UCloud小助手个人空间

Hello GPT-4o，GPT-4o快速上手！

本文梳理了OpenAI团队最新的GPT-4.o（o代表omni 全方位）模型发布内容，以OpenAI团队发布会口吻整理。我们很高兴地宣布，推出了全新的旗舰模型 GPT-4o，能够在音频、视觉和文本之间实时进行推理。GPT-4o（o代表omni 全方位）能够实时处理音频...

UCloud小助手发布了文章 · 2024-05-22 15:40

照片+音频=视频，超实用项目源码已开放，单卡4090部署！

项目简介AniTalker是一个开源项目，它利用静态照片和音频文件来创造动态的面部说话视频。AniTalker采用了一种通用的运动表示方法。这种创新的表示方法有效地捕捉了广泛的面部动态，包括微妙的表情和头部动作。AniTalker通过两种自监督学习策略增强了运动描述...

UCloud小助手发布了文章 · 2024-05-22 15:34

谷歌发布Veo：文生超1分钟、1080P视频媲美Sora

Veo是什么Veo是由Google DeepMind开发的一款视频生成模型，用户可以通过文本、图像或视频提示来指导其生成所需的视频内容，能够生成时长超过一分钟1080P分辨率的高质量视频。Veo拥有对自然语言的深入理解能够准确捕捉和执行各种电影制作术语和效果，如延时摄...

UCloud小助手发布了文章 · 2024-05-22 15:32

微软发布最强Al电脑:Copilot+PC，能听、能看、能说而且能记住你一切

5月20日，微软在其特别活动上，向世界介绍了一种新类别的WindowsPC，一款专为AI设计的Copilot+ PC。Copilot+ PC引入了全新的系统架构，将 CPU、GPU和高性能神经处理单元(NPU)结合在一起，并与 Azure 云中的大语言模型(LLM)和小语言模型(SLM)协同工作，带来前...

UCloud小助手发布了文章 · 2024-05-22 15:30

DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

项目简介DeepSeek-V2，一个专家混合(MoE)语言模型，其特点是经济高效的训练和推理。它包含 2360 亿个总参数，其中每个token激活了21亿个参数。与 DeepSeek67B相比，DeepSeek-V2 实现了更强的性能，同时节省了 42.5%的训练成本，将 KV 缓存减少了 93.3%，并将...

UCloud小助手发布了文章 · 2024-05-16 09:54

DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

Llama3中文聊天项目全能资源库，4090单卡直接跑！

Llama3 中文聊天项目综合资源库，该文档集合了与Lama3 模型相关的各种中文资料，包括微调版本、有趣的权重、训练、推理、评测和部署的教程视频与文档。1. 多版本支持与创新：该仓库提供了多个版本的Lama3 模型，包括基于不同技术和偏好的微调版本，如直接中文...

UCloud小助手发布了文章 · 2024-05-16 09:45

能自动化视频剪辑的开源工具来了！剪辑师、自媒体作者狂喜

项目简介Funclip 是阿里巴巴通义实验室开源的一款视频剪辑工具，专门用于精准、便捷的视频切片。它能够自动识别视频中的中文语音并允许用户根据语音内容来裁剪视频。该工具使用了阿里巴巴语音识别模型FunASR Paraformer-Large确保了剪辑的精准性。你可以根据...

UCloud小助手发布了文章 · 2024-05-16 09:40

高性价比GPU算力平台推荐，4090仅需2.6元/小时，开冲！

ChatGPT和Sora等AI大模型应用，将AI大模型和算力需求的热度不断带上新的台阶。哪里可以获得廉价算力，进行AI视频生成等模型开发和应用呢？Compshare是隶属于UCloud云计算的GPU算力平台，专注提供高性价比的NVIDIA RTX 40 系列资源，满足 AI应用、模型推理/微...

UCloud小助手发布了文章 · 2024-05-14 11:33

将Llama-3 的上下文长度从8K扩展到超过100万！

Gradient Al最近将Llama-3 8B和7B模型通过渐进式训练方法不断将Llama-3模型的上下文长度从8k-路扩展到262k、524k今天Gradient Al成功宣布成功地将Llama-3 系列模型的上下文长度扩展到超过1 M...并且1M上下文窗口 70B 模型在 NIAH(大海捞针)上取得了完美分数。...

UCloud小助手发布了文章 · 2024-05-07 18:44

英伟达推出视觉语言模型：VILA，这不得拿4090试试水？

NVIDIA和MIT的研究人员推出了一种新的视觉语言模型(VLM)预训练框架，名为VILA。这个框架旨在通过有效的嵌入对齐和动态神经网络架构，改进语言模型的视觉和文本的学习能力。VILA通过在大规模数据集如Coy0-700m上进行预训练，采用基于LLaVA模型的不同预训练策略...

UCloud小助手发布了文章 · 2024-05-06 18:51

英伟达推出视觉语言模型：VILA，这不得拿4090试试水？

NVIDIA和MIT的研究人员推出了一种新的视觉语言模型(VLM)预训练框架，名为VILA。这个框架旨在通过有效的嵌入对齐和动态神经网络架构，改进语言模型的视觉和文本的学习能力。VILA通过在大规模数据集如Coy0-700m上进行预训练，采用基于LLaVA模型的不同预训练策略...

UCloud小助手发布了文章 · 2024-05-06 18:51

ollama-python-Python快速部署Llama 3等大型语言模型最简单方法

ollama介绍在本地启动并运行大型语言模型。运行Llama 3、Phi 3、Mistral、Gemma和其他型号。Llama 3Meta Llama 3 是 Meta Inc. 开发的一系列最先进的模型，提供8B和70B参数大小（预训练或指令调整）。Llama 3 指令调整模型针对对话/聊天用例进行了微调和优化...

UCloud小助手发布了文章 · 2024-04-30 17:52

ollama-python-Python快速部署Llama 3等大型语言模型最简单方法

变革！Perplexica：AI驱动的问答搜索引擎

Perplexica是一个开源的人工智能搜索工具，也可以说是一款人工智能搜索引擎，它深入互联网以找到答案。受Perplexity AI启发，它是一个开源选择，不仅可以搜索网络，还能理解您的问题。它使用先进的机器学习算法，如相似性搜索和嵌入式技术，以精细化结果，并...

UCloud小助手发布了文章 · 2024-04-29 18:49

Llama3-8中文微调完成！更好地帮助中文写作、编程和数学

Llama3-8B-Chinese-Chat 是基于 Meta-Llama-3-8B-Instruct 模型通过 ORPO进行微调的中文聊天模型。与原始的 Meta-Llama-3-8B-Instruct 模型相比，此模型显著减少了中文问题英文回答"和混合中英文回答的问题。此外，相较于原模型，新模型在回答中大量减少了...

UCloud小助手发布了文章 · 2024-04-28 17:57