文章库ARTICLE COLUMN

  • 英伟达推出视觉语言模型:VILA,这不得拿4090试试水?

    英伟达推出视觉语言模型:VILA,这不得拿4090试试水?

    NVIDIA和MIT的研究人员推出了一种新的视觉语言模型(VLM)预训练框架,名为VILA。这个框架旨在通过有效的嵌入对齐和动态神经网络架构,改进语言模型的视觉和文本的学习能力。VILA通过在大规模数据集如Coy0-700m上进行预训练,采用基于LLaVA模型的不同预训练策略...

    UCloud小助手UCloud小助手 评论0 收藏0
  • ChatTTS打破人机对话的壁垒!短视频、小说配音,营销推广场景大杀器!

    ChatTTS打破人机对话的壁垒!短视频、小说配音,营销推广场景大杀器!

    过去我们让AI说话,它给出的总是不咸不淡的机器合成声音,毫无波澜的死板音调让人听得昏昏欲睡。但由于chatTTS的到来,一切都将会变得不一样。作为一款强大的对话式文本转语音模型,它完美解决了用户对于生动对话的需求。如此功能不可小觑,可以称得上在业界...

    UCloud小助手UCloud小助手 评论0 收藏0
  • DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

    DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

    项目简介DeepSeek-V2,一个专家混合(MoE)语言模型,其特点是经济高效的训练和推理。它包含 2360 亿个总参数,其中每个token激活了21亿个参数。与 DeepSeek67B相比,DeepSeek-V2 实现了更强的性能,同时节省了 42.5%的训练成本,将 KV 缓存减少了 93.3%,并将...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 照片+音频=视频,超实用项目源码已开放,单卡4090部署!

    照片+音频=视频,超实用项目源码已开放,单卡4090部署!

    项目简介AniTalker是一个开源项目,它利用静态照片和音频文件来创造动态的面部说话视频。AniTalker采用了一种通用的运动表示方法。这种创新的表示方法有效地捕捉了广泛的面部动态,包括微妙的表情和头部动作。AniTalker通过两种自监督学习策略增强了运动描述...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 超越Llama3,多模态比肩GPT4V:GLM-4智能体,新一代语言处理利器

    超越Llama3,多模态比肩GPT4V:GLM-4智能体,新一代语言处理利器

    在人工智能领域,自然语言处理技术一直备受关注。就在昨日,今年备受关注的国内AI公司北京智谱AI发布了第四代 GLM 系列开源模型:GLM-4-9B。这是一个集成了先进自然语言处理技术的创新平台,它凭借清华大学KEG实验室提出的GLM模型结构,为智能体功能的发展带来...

    UCloud小助手UCloud小助手 评论0 收藏0
  • Mem0:个性化的AI记忆层,一款开源的大语言记忆增强工具

    Mem0:个性化的AI记忆层,一款开源的大语言记忆增强工具

    在人工智能的浪潮中,个性化体验已成为创新的关键。而随着各种各样的模型迭代更新,如何为AI应用提供持久、智能的记忆系统逐渐成为了一个关键挑战。最近开源的Mem0项目为我们提供了一个强大的解决方案。它为大型语言模型(LLM)提供了一个智能、自我优化的记忆...

    UCloud小助手UCloud小助手 评论0 收藏0
  • Khoj:一个开源的个人化AI助手,能连接你的在线和本地文档 充当你的第二大脑

    Khoj:一个开源的个人化AI助手,能连接你的在线和本地文档 充当你的第二大脑

    项目简介Khoj是一个开源的、个人化的AI助手,旨在充当你的第二大脑。它能够帮助你回答任何问题,不论这些问题是在线上的还是在你自己的笔记中。Khoi 支持使用在线AI模型(例如 GPT-4)或私有、本地的语言模型(例如 Llama3)。你可以选择自托管 Khoj,也可以使用...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 直播带货大模型,开启自动卖货的时代!

    直播带货大模型,开启自动卖货的时代!

    Streamer-Sales是一个为直播带货主播量身定制的智能工具。它能够智能分析商品特性,自动创作出引人入胜的解说词,从而有效增强商品的吸引力和提升销售业绩。它还具备多种交互功能,比如将主播的语音实时转换为文字,便于与观众进行更直接的交流。它还能够生成...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 黄仁勋口中“生物工程化”的美好愿景,正在被这家公司努力变成现实

    黄仁勋口中“生物工程化”的美好愿景,正在被这家公司努力变成现实

    6月20日,一家为人类细胞编码新疗法的公司,也是合成生物学领域的先驱英国合成生物公司bit.bio宣布推出ioAstrocytes,这是一种功能性人类iPSC(诱导多能干细胞)衍生的星形胶质细胞,科学家表示该产品为中枢神经系统(CNS)药物研发打开了新的大门,该产品组...

    UCloud小助手UCloud小助手 评论0 收藏0
  • Mistral联合英伟达开源12B小模型:碾压Llama 3,单张4090可跑

    Mistral联合英伟达开源12B小模型:碾压Llama 3,单张4090可跑

    小模型,成为本周的AI爆点。与动辄上千亿参数的大模型相比,小模型的优势是显而易见的:它们不仅计算成本更低,训练和部署也更为便捷,可以满足计算资源受限、数据安全级别较高的各类场景。因此,在大笔投入大模型训练之余,像 OpenAI、谷歌等科技巨头也在积极...

    UCloud小助手UCloud小助手 评论0 收藏0
  • OpenAI开发ChatGPT“反作弊神器”,99.9%超高命中率,好消息:还没上线

    OpenAI开发ChatGPT“反作弊神器”,99.9%超高命中率,好消息:还没上线

    检查内容是否用了ChatGPT,准确率高达99.9%!OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓「AI枪手」作弊代写。其能够精准识别出论文或研究报告是否由ChatGPT撰写,甚至能追溯其使用的具体时间点。它能专门用来检测是否用ChatGPT水了论文...

    UCloud小助手UCloud小助手 评论0 收藏0
  • Code2prompt:探索高效代码编辑新纪元的开源模型工具

    Code2prompt:探索高效代码编辑新纪元的开源模型工具

    项目介绍Code2prompt 是一个命令行工具,能将你的代码库转化为单一的大型语言模型(LLM)提示,结合源码树结构,模板定制,以及令牌计数。它旨在简化与高级上下文窗口模型如GPT或Claude的交互,助你在重写代码、查找bug、编写文档和实现新功能等方面提升效率...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 国产Sora免费体验-快手旗下可灵大模型发布

    国产Sora免费体验-快手旗下可灵大模型发布

    自从OpenAI公布了Sora后,震爆了全世界,但由于其技术的不成熟和应用的局限性,未能大规模推广,只有零零散散的几个公布出来的一些视频。昨日,快手成立13周年,可灵(Kling)大模型发布,体验后不由得感叹,炸裂,太震撼了,快手可灵,除了那个没发布的Sora...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 无问芯穹Qllm-Eval:制作多模型、多参数、多维度的量化方案

    无问芯穹Qllm-Eval:制作多模型、多参数、多维度的量化方案

    前言近年来,大语言模型(Large Models, LLMs)受到学术界和工业界的广泛关注,得益于其在各种语言生成任务上的出色表现,大语言模型推动了各种人工智能应用(例如ChatGPT、Copilot等)的发展。然而,大模型的落地应用受到其较大的推理开销的限制,对部署资源...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 快手开源LivePortrait:将照片变为生动视频,实现表情姿态极速迁移

    快手开源LivePortrait:将照片变为生动视频,实现表情姿态极速迁移

    近日,当下炙手可热的快手宣布开源旗下明星产品可灵中一项重要技术项目LivePortrait。,该框架能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果。如下动图所示:LivePortrait的主要功能包括从单一图像生成生动动...

    UCloud小助手UCloud小助手 评论0 收藏0
  • OpenAI终止对中国提供API服务,开发者们该如何应对?

    OpenAI终止对中国提供API服务,开发者们该如何应对?

    6月25日凌晨,陆续有包括中国大陆在内的各国和相关地区API开发者在社交媒体上表示,他们收到了来自一封来自OpenAI的警告信。其内容是:我们的数据显示,贵组织的 APl 流量来自OpenAl目前不支持的地区。您可以在此处找到受支持的国家和地区。我们将从7月...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 智谱 AI 开源视频生成模型CogVideoX:单张 4090 显卡即可推理

    智谱 AI 开源视频生成模型CogVideoX:单张 4090 显卡即可推理

    随着大型模型技术的持续发展,视频生成技术正逐步走向成熟。以Sora、Gen-3等闭源视频生成模型为代表的技术,正在重新定义行业的未来格局。而近几个月,国产的AI视频生成模型也是层出不穷,像是快手可灵、字节即梦、智谱清影、Vidu、PixVerse V2 等。就在近日,...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 网页开发助手——自动编写运行代码

    网页开发助手——自动编写运行代码

    v0是一个专为网页开发设计的智能助手,它通过对话形式提供服务。你可以与v0进行互动,无论是代码调试、解答编程问题还是生成代码片段,v0都能在前端开发领域提供专业的帮助。它精通TypeScript、React、Next.js、Vercel等前端技术,能够为你提供深入的技术指导...

    UCloud小助手UCloud小助手 评论0 收藏0
  • Hello GPT-4o,GPT-4o快速上手!

    Hello GPT-4o,GPT-4o快速上手!

    本文梳理了OpenAI团队最新的GPT-4.o(o代表omni 全方位)模型发布内容,以OpenAI团队发布会口吻整理。我们很高兴地宣布,推出了全新的旗舰模型 GPT-4o,能够在音频、视觉和文本之间实时进行推理。GPT-4o(o代表omni 全方位)能够实时处理音频...

    UCloud小助手UCloud小助手 评论0 收藏0
  • Openai 放出大招!O1: 迈向下一代人工智能的2.0时代

    Openai 放出大招!O1: 迈向下一代人工智能的2.0时代

    OpenAI最近发布了新一代AI推理模型——o1,标志着其在复杂推理任务上的重大进展。该模型包括两个版本:o1-preview和o1-mini,分别针对复杂推理和快速处理任务。模型需要长时间思考,非GPT家族,调用方式需要修改调用成本3倍起步调用次数严格限制,每周几十次...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 谷歌发布Veo:文生超1分钟、1080P视频媲美Sora

    谷歌发布Veo:文生超1分钟、1080P视频媲美Sora

    Veo是什么Veo是由Google DeepMind开发的一款视频生成模型,用户可以通过文本、图像或视频提示来指导其生成所需的视频内容,能够生成时长超过一分钟1080P分辨率的高质量视频。Veo拥有对自然语言的深入理解能够准确捕捉和执行各种电影制作术语和效果,如延时摄...

    UCloud小助手UCloud小助手 评论0 收藏0
  • Meta强势发布开源大模型Llama 3.1:打响硅谷AI保卫战

    Meta强势发布开源大模型Llama 3.1:打响硅谷AI保卫战

    在很长一段时间内,占据大模型评测榜单最前列的大多是一些闭源模型,直到Meta再次发布了最新的开源模型。就在近日,Meta和OpenAI打响了硅谷 AI 大模型保卫战。美国当地时间7月23日,Meta正式发布Llama 3.1。其包含8B、70B 和405B三个规模,最大上下文提升到了...

    UCloud小助手UCloud小助手 评论0 收藏0
  • Adobe推出最新开源工具:视频中插入魔性手绘

    Adobe推出最新开源工具:视频中插入魔性手绘

    在视频中插入手绘动画!传统上这是一项非常困难的任务,但 VideoDoodles 让它成为可能。VideoDoodles是Adobe公司联合多所大学推出的AI视频编辑框架。支持用户在视频中轻松插入手绘动画,实现与视频内容的无缝融合。通过预处理视频帧,系统提供平面画布,用户...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 北大发布PAS:数据高效的即插即用提示增强系统

    北大发布PAS:数据高效的即插即用提示增强系统

    近年来,大型语言模型(LLM)的诞生刺激了对即插即用人工智能系统的需求不断增长,而在各种人工智能技术中,Prompt工程,即通过不断调整给予大模型的指令以优化大模型生成结果显得尤为重要。然而,由于陡峭的学习曲线和大量的时间投入,用户在编写提示时经常...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 微软发布最强Al电脑:Copilot+PC,能听、能看、能说 而且能记住你一切

    微软发布最强Al电脑:Copilot+PC,能听、能看、能说 而且能记住你一切

    5月20日,微软在其特别活动上,向世界介绍了一种新类别的WindowsPC,一款专为AI设计的Copilot+ PC。Copilot+ PC引入了全新的系统架构,将 CPU、GPU和高性能神经处理单元(NPU)结合在一起,并与 Azure 云中的大语言模型(LLM)和小语言模型(SLM)协同工作,带来前...

    UCloud小助手UCloud小助手 评论0 收藏0
  • 1
  • 2
  • 3
  • 373

热门文章

<