太好了是开源 3D 模型,我们有救了!

发布日期:2024-11-13 18:14

来源类型:直新闻 | 作者:Bel

阅读提醒: 内容编辑丨特工女巫 排版审核丨特工少女 还记得在 23 年,女巫有一个遗憾。当时参与一个 AI 项目,想用 GenAI 能力让用户个性化地创作 IP 形象的玩偶、模型,或者包...
【2024澳门码今晚开奖结果】 【新奥免费精准资料大全】 【澳门天天免费精准大全】 【新澳资料正版免费资料】 【新奥2024年免费资料大全】 【澳门新三码必中一免费】 【二四六澳门免费全全大全】 【新澳免费资料】 【2024新奥免费资料】 【新澳2024资料免费大全版】 【2024新澳最快最新资料】 【新澳精准资料免费提供最新版】 【二四六香港资料期期准一】

内容编辑丨特工女巫

排版审核丨特工少女

还记得在 23 年,女巫有一个遗憾。当时参与一个 AI 项目,想用 GenAI 能力让用户个性化地创作 IP 形象的玩偶、模型,或者包装盒的立体效果图。

但与团队讨论,结论是,由于市面上还没有很好的开源的 3D 模型可以用,其他技术方案开发成本又比较高,生成 3D 内容的想法于是作罢。

转眼一年不到,惊喜地发现混元上了个 3D 模型,可以轻松实现当年的预期效果了。

光说不做假把式,腾讯混元 3D 生成大模型已经与腾讯内部业务场景结合落地了,如 UGC 3D 创作、商品素材合成、游戏 3D 资产生成等。

此前,腾讯地图就利用混元 3D 大模型,上线了「自定义 3D 导航车标」功能。用户可以创作个性化的 3D 导航车标。

腾讯混元 3D 大模型,相比传统方案,使 3D 车标生成速度提升了 91.1%,生成成功率从 50% 提升至 97.4%,从个性化新意和效率上都提升了用户体验。

此外,元宝里的「3D 角色梦工厂」功能,也正是基于混元 3D 团队的技术。

用户只需上传一张五官清晰的正面头像,选择不同角色模版,就能迅速生成个性化的 3D 人物形象。3D 形象生成完成后,用户可以对形象从 360 度随意查看,也可以选择把形象分享公开,将 UGC 曝光到平台。

此前吴恩达在一次线上采访交谈中( 吴恩达,对 Agentic Workflow 持续兴奋 ),也表示了他对于 AI 业内开源闭源争议的看法。

吴恩达认为更多的开源会让世界变得更好,让很多人过得更好;闭源实际上是非常危险的,这不利于创新,不利于融入世界 LLM 的供应链中;开源带来的好处远大于闭源造成的伤害。

业内已经看到的如国内的通义、国外的 Llama 系列模型热衷开源步调,腾讯混元大模型也正在加速开源节奏。

自从上次 5 月 14 日混元将其文生图大模型对外开源,成为业内首个中文原生的 DiT 架构文生图开源模型。

就在今天 11 月 5 日,特工们注意到,混元宣布了最新的 3D 生成模型「Tencent-Hunyuan3D-1.0」正式开源,包括模型权重、推理代码、模型算法的全面开源;开发者可在 Huggingface、GitHub 等技术社区直接下载。

据悉, Tencent-Hunyuan3D-1.0 又是业界首个同时支持文生 3D、图生 3D 的开源模型?

论文地址:https://3d.hunyuan.tencent.com/hunyuan3d.pdf

3D 模型是 GenAI 多模态内容生成的关键,使模型生成能力更加接近现实世界真实立体事物的生产。

对于一个 3D 模型,可以从生成内容的质量、速度、泛化性角度考察。

1. 质量方面,经过多个维度测评,在两个公开的 3D 数据集 GSO 与 OmniObject3D 上, Tencent-Hunyuan3D-1.0 效果优于主流开源模型,并且生成质量上全面超过了 SOTA 开源模型,整体能力属于国际领先水平。

2. 速度方面,据官方公开披露,Tencent-Hunyuan3D-1.0 最快仅需 10s 即可生成一个 3D 作品,缩短的时长对用户来说是友好且效率的。

3. 泛化性方面,混元 3D 生成大模型可构建各类尺度、形态、场景的物体,大型如建筑楼宇,细微如花草动物。

为了提升上述提及的过往 3D 生成模型在生成速度和泛化能力上的不足,混元团队采用了两阶段生成方法,既保证基础的生成的质量和可控,又能加快生成速度。

第一阶段,腾讯混元采用的是一种轻量级的多视角扩散模型,它可以在约 6 秒内高效生成多视角图像。这一步的作用在于,将一个整体的复杂 3D 生成任务,通过不同视角捕捉的 3D 资产的纹理和几何特征,从单视角重建转化为难度更低的多视角重建任务。就好像一个美术生,对一个复杂立方体,先分别观察其各个面的细节。

第二阶段,腾讯混元引入了一种快速的重建大模型,利用上一阶段生成的多视角图像,这个模型能够在大约 3 秒内快速而准确地重建 3D 资产。重建模型的强大之处在于,它可以学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复 3D 结构。最终,该模型可以实现输入任意单视角生成 3D 资产。就像上述美术生观察完各面后,还会主动学习思考如何更好处理各面的质量,最终制作一个 3D 作品。

总体来说,此次腾讯混元开源的 Tencent-Hunyuan3D-1.0,相较于过往的 3D 模型,在生成速度和泛化能力上有较大提升;不难想象,这样一款更强的 3D 生成大模型,可以帮助设计师、创作者、艺术家等自动化生产 3D 资产;在玩具手办、3D 打印、广告舞美等行业,用于数字或实物商品的制作,激发个性化创意,提高生产效率。

除此之外,在大语言模型方面,特工也关注到腾讯还开源了更强大的 MoE 开源大语言模型——「腾讯混元Large」,它具有以下几点特质。

1. MoE 混合专家结构:每一层都包含多个并行的同构专家,一次 token 的前向计算只会激活部分专家,是一种稀疏的网络结构,因而推理成本远低于同等参数的稠密模型,这使得混元 Large 可以在保证模型推理速度的同时,显著提升模型的参数量进而提升模型性能。 Large 模型还创新了路由策略,提出随机补偿的路由方式,有效提升模型内专家的利用率和稳定性,从而提升模型性能表现

2. 参数量和上下文长度:模型总参数量 389B,激活参数量 50B,上下文长度达 128k, 是当前业界参数规模最大、效果最好的开源 MoE 模型。(根据公开的测评结果,腾讯混元 Large 在 CMMLU、MMLU、CEval、AGIEval 等多学科综合评测集、中英文 NLP 任务、代码和数学等 9 大维度全面领先,超过 Llama3、Mixtral 等国外一流的开源大模型)

3. 高质量训练数据:LLM 的进步与数据密不可分,混元 Large 模型在天然文本语料库的基础上,利用大语言模型构建了高质量、高多样性、大量级的合成数据,提升了模型在长文、数学和代码等各个领域的性能。

4. 开发者友好:同时,混元通过技术优化,将 Large 模型变得更适配开源框架的精调和部署,对开发者来说很实用。

目前,腾讯混元大模型 PaaS 平台已开放支持包含混元 Large 模型在内的十余种混元 API 服务调用,可以满足企业及开发者对于不同模态(文生文、图生文、文生图)、不同专项(角色扮演、Function-Call、代码等)的模型需求。

1. github(开源模型工具包):https://github.com/Tencent/Hunyuan-Large

2. huggingface(模型卡片&模型上传):https://huggingface.co/tencent/Hunyuan-Large/tree/main

3. huggingface demo 地址:https://huggingface.co/spaces/tencent/Hunyuan-Large返回搜狐,查看更多

责任编辑:

【澳门准六肖期期准免费公开】 【新奥最准免费资料大全】 【新澳精准资料大全免费】 【2024新澳门开奖记录】 【新澳今天最新资料网站】 【2023资料免费大全】 【新澳最新最快资料】 【新澳2024年精准正版资料】 【新澳2024正版免费资料】 【正版资料免费大全】 【7777788888澳门开奖2023年一】 【2024香港澳门免费资料】 【2024新奥今晚开奖号码】 【新澳资料最准的网站】
【澳门2024正版免费资】 【新澳天天彩正版免费资料观看】 【新澳开奖记录今天结果】 【777778888王中王最新】 【新澳正版资料免费大全】 【二四六天天彩免费资料大全最新】 【2024新澳门姿料】 【新澳2024年正版资料】 【新澳好彩免费资料查询最新版本】 【2024天天开好彩大全】 【新澳门彩出特生肖走势】 【新澳论坛免费资料】 【2024天天彩正版资料大全】 【新澳好彩免费资料查询2024期】

下载中心

视频封面

视频名称:首次引入,两个为国内首展!均免费开放

大小: 7.7GB 下载:(46325) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:2024年甘肃省“最美科技工作者”发布

大小: 5.7GB 下载:(210848) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:刘德华等502人获授勋或嘉奖丨香港一日

大小: 3.7GB 下载:(508245) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:多地已实施!妇女可以依法查询配偶财产状况

大小: 3.2GB 下载:(948449) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:从全民补贴感受在日外国人的权利与义务

大小: 9.5GB 下载:(908625) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:蓝佛安在解决存量债务风险的同时,必须坚决遏制新增隐性债务看完3集《山花烂漫时》,我难掩激动心情,写下这篇文章

大小: 5.5GB 下载:(225709) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:如何促进经济金融良性循环?银行业保险业这样做

大小: 3.3GB 下载:(945634) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:随着高芙2-1逆转郑钦文夺冠,产生4个不可思议,还有3个不争事实

大小: 1.9GB 下载:(279435) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:怒怼彭斯演讲的台湾名嘴:我觉得我得帮我们中国讲点话

大小: 5.6GB 下载:(244183) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:郑州、开封同时宣布:今晚禁行!

大小: 4.1GB 下载:(707767) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:来珠海的歼-15T换了太行,航母上却还用俄发?解放军此举有深意

大小: 7.6GB 下载:(685140) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:直播吧向北京高院申请复议,“懂球帝”争夺战还没结束

大小: 8.2GB 下载:(842247) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:已致4人死亡!云南一家庭发生一氧化碳中毒事件今日穿搭分享

大小: 6.9GB 下载:(552020) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:锗需求激增62%!卫星互联网时代来临,稀有金属市场面临重大挑战

大小: 4.1GB 下载:(763414) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:怪事

大小: 9.3GB 下载:(793676) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:健康饮食新趋势,百年阿华田如何破局

大小: 5.1GB 下载:(564414) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:2024潞村论坛在浙江湖州举行首批“原生态研究生”出现:2025考研禁用海马体照片,女同学慌了

大小: 1.4GB 下载:(973144) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:特朗普胜选,陆克文紧急删帖,国内很多公知们开始坐立不安了

大小: 3.3GB 下载:(124513) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:真正的有福之人,一辈子有三不碰,越不碰就越好命为什么满人会出现爷爷姓米,爸爸姓李,儿子姓傅这种奇怪现象?

大小: 5.7GB 下载:(543325) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:地球局特朗普重返白宫对世界意味着什么

大小: 9.1GB 下载:(1017) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:美团闯中东

大小: 6.3GB 下载:(234506) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:汉景帝为何要杀晁错,也是被逼无奈,不杀晁错,他赢不了七王之乱

大小: 6.1GB 下载:(273890) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:10万亿救急!这个政策将如何改变地方财政命运

大小: 2.7GB 下载:(148226) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:亚马逊扫号或有新动向?卖家深陷欧洲合规“泥潭”!

大小: 7.1GB 下载:(696443) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:政府补贴加码!叠加天猫双11优惠并支持跨店满减,低至55折事实表明,收入永远对半分的凤凰传奇,彻底的走上了一条康庄大道

大小: 1.9GB 下载:(86145) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:蜘蛛为什么不是昆虫,难道是法布尔研究错了?

大小: 5.9GB 下载:(205104) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:火了!多家银行集体出手

大小: 9.4GB 下载:(27682) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:11月10日截止12点实时热点新闻简讯一分钟了解天下事

大小: 5.5GB 下载:(654353) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:川大臭了,继张薇事件之后,四川大学又因招生简章被骂上热搜

大小: 9.6GB 下载:(476434) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:新中国成立主题片区联席会议成立大会在香山革命纪念馆举行

大小: 9.6GB 下载:(288350) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:家长排不上为何黄牛能约到?山东省科技馆免费票被卖到30元人

大小: 4.9GB 下载:(296472) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)

评论

打开APP查看18条评论

林浩文

6秒前

业内已经看到的如国内的通义、国外的 Llama 系列模型热衷开源步调,腾讯混元大模型也正在加速开源节奏。

贾永红

3分钟前

3.

海林·坎德米尔

9天前

3D 模型是 GenAI 多模态内容生成的关键,使模型生成能力更加接近现实世界真实立体事物的生产。

发表您的评论: