李开复零一万物公司回应大模型争议：承认模型结构基于

必一体育:李开复零一万物公司回应大模型争议：承认模型结构基于

栏目：公司动态发布时间 2024-12-23 10:37:08 来源：必一B体育下载作者：必一体育app官方

　　」的大模型 Yi-34B 引发争议，因研究者发现其基本采用 LLaMA 架构，但只是对两个张量进行了重命名。

　　2. 有关该模型的性能和成就，包括上下文窗口大小超过200k、一次处理40万汉字、在 Hugging Face 全球开源模型排行榜中获得双料冠军等。

　　3. 在社区中有人指出，Yi-34B 实际上是对 LLaMA 代码的一次重构，但未作实质性改变，引起对虚假宣传、许可证违规等问题的疑虑。公司回应表示基于 GPT 结构，并在模型训练中遇到的一些需求导致了代码重命名。

　　站长之家（11月15日消息:最近，「零一万物」公司旗下的大模型 Yi-34B 因使用 LLaMA 架构但改变张量名引发争议。这一争议中，研究者指出其代码实际上是对 LLaMA 代码的一次重构，只是未作实质性改变。社区担心这可能违反了许可证规定，且未经过框架支持的外部代码附加可能存在安全风险。

　　Yi-34B 的成就在开源大模型领域引起了广泛关注，其上下文窗口大小超过200k，能处理40万汉字，成为全球开源模型双料冠军。然而，争议的核心在于其是否真正符合 LLaMA 的许可协议，以及对模型代码的更改是否属于虚假宣传。

　　在社区的讨论中，有人提到模型的性能参数和配置存在疑虑，包括模型被标榜为32K 模型实际上配置为4K 模型的问题。此外，对于模型的微调数据和基准测试的信息也没有充分提供，引起了社区的疑虑。

　　「零一万物」公司回应称，他们的模型结构基于 GPT 成熟结构，但在训练实验中由于需求对代码进行了更名。他们强调模型的结构只是其中一部分，投入了大量研发工作在数据工程、训练方法、评估方法等方面，这是他们在大模型预训练阶段的核心技术护城河。最后，他们表示尊重社区的反馈，将代码进行更新以更好地融入 Transformer 生态。

　　综合来看，争议集中在「零一万物」公司的 Yi-34B 模型是否违反了开源协议，以及其在性能参数和代码修改上的透明度。这一事件提醒开源社区对于模型的合规性和透明度的重要性，同时也反映了在开源领域中公司的技术选择可能引发广泛关注和争议的现实。

　　11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

　　11月24日，零一万物基正式发布并开源微调模型Yi-34B-Chat，可申请免费商用。零一万物还为开发者提供了4bit/8bit量化版模型，Yi-34B-Chat4bit量化版模型可以直接在消费级显卡上使用。Yi系列模型已在ModelScope社区开源，开发者可以在社区中下载、推理和训练这些模型。

　　仅次于GPT-4，李开复零一万物Yi-34B-Chat最新成绩公布——在Alpaca经认证的模型类别中，以94.08%的胜率，超越LLaMA2Chat70B、Claude2、ChatGPT!不仅如此，在加州大学伯克利分校主导的LMSYSORG排行榜中，Yi-34B-Chat也以1102的Elo评分，晋升最新开源SOTA开源模型之列，性能表现追平GPT-3.5。在五花八门的大模型评测中，伯克利LMSYSORG排行榜采用了一个最为接近用户体感的“聊天机器人竞技场”特殊测评模式，让众多大语言模型在评测平台随机进行一对一battle，通过众筹真实用户来进行线上实时盲测和匿名投票，11月份经25000的线个大模型的总得分。”现在，Eric已经成为Yi-34B的忠实拥趸，会使用Yi-34b-200k数据集训练其他的模型产品，并感叹丝滑般的训练体验。

　　华中科技大学官方发文称，该校软件学院一团队发布了多模态大模型Monkey”。该模型擅长图像描述和视觉问答，能够实现对世界的观察”，对图片进行深入问答交流和精确描述。值得一提的是，该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。

　　今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”，据不完全统计，今年1-7月国内共发布了64个大模型，截至目前叫得出名字的国产大模型已接近200家。这么多大模型，哪些是真能打的?在每天冒出来的各类“榜单”上出现了“家家第一”的情况，甚至已不止一款国产大模型“碾压”了GPT-4，且很多“世界”大模型是出自刚成立的团队之手。有没有B端客�

　　李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型，尤其在加州大学伯克利分校主导的LMSYSORG排行榜中，以1102的Elo评分追平了GPT-3.5。这一系列的成绩和问题共同勾勒出Yi-34B-Chat模型的成功轨迹，尽管受到一些质疑，但其在技术创新和用户体验方面的表现仍然备受瞩目。

　　汉字序顺并不定一影阅响读。日本东京大学的一项实验发现，这个“定理”居然也适合GPT-4。他还把这段内容放进了OpenA官方的tokenizer工具，发现GPT-4看到的token其实是这样的:这里面除了“UNDER”、“SEA”和“OF”之外，几乎剩下的所有token都看起来“毫无逻辑”，这更加使人费解了。

　　在理想汽车智能软件发布会上，理想带来了MindGPT，这是理想全自研的多模态认知大模型，目前还处于内测版本。MindGPT是行业唯一不需要任何指令词就可以使用的大模型，也是行业唯一真正围绕车载场景打造的大模型。理想汽车全国405家零售中心的展车及试驾车已全部全面升级至OTA5.0内测版，迎接用户到店体验。

　　gptcrawler是一款强大的工具，能够将网站内容全面地爬取下来，并将其转换成结构化知识，为GPTs的学习提供了有力支持。这个工具的应用场景广泛，比如，如果你想打造一个数字人分身，可以先将自己在社交媒体或个人博客上的内容抓取下来，然后提交给ChatGPT作为储备知识。Crawlee还提供了大量的配置项，用户可以根据自己的需求进行灵活设置，从更好地适应不同的爬取任务。

　　“取消今晚所有计划!”，许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由MistralAI发布。最新的梗图:磁力链接就是新的arXiv。

　　2022年底，ChatGPT推出后迅速在社交媒体上走红，很快，月活用户突破1亿，成为史上增长最快的消费者应用。国内也掀起了一场轰轰烈烈的大模型竞赛，下场的企业越来越多，都在扬言要赶超ChatGPT。在没有自研AI技术加持的前提下，妙鸭相机在爆火后，很快就冷了下来。

　　Diyva是一个AI助手，使用人工智能技术，可以与客户进行对话，并提供准确的、即时的答案。它可以收集和分析客户交互数据，提供有关客户需求和个性化推荐的实时洞察。Diyva提供24/7的多语言客户服务，提供精确、准确、即时的答案。Diyva可以与现有的文档、产品目录等进行集成，快速、轻松地设置。

　　Crit Design是一个基于ChatGPT-4的浏览器插件。它能够快速评估设计,提出修改建议,编写alt文本等,是设计师的最佳工作伙伴,能够极大提高设计流程的效率。

　　Find My Remote 是您通往遥控技术机会的入口。通过实时监控 15 个以上的招聘软件和 30 个以上的职位平台，简化您的求职过程。获得个性化的工作推荐，访问庞大的职位数据库，并加入蓬勃发展的遥控求职者社区。立即开始寻找您梦寐以求的遥控技术工作吧！

　　FeedLoops是一个由AI驱动的反馈和评论收集工具。它可以大规模地收集有价值的客户反馈,并通过引导他们在流行的平台上留下正面评论,将满意的客户转化为代言人。主要功能包括: - 避免潜在的负面评论:将建设性反馈私下处理,避免公开的负面评价 - 主动解决客户问题:及时解决客户关切问题,改进服务 - 深入分析客户情绪:洞察客户真实情感,制定业务优化决策 - 自动化反馈收集:取代麻烦的表格,AI聊天机器人以友好交流方式大规模获取有价值反馈典型使用场景包括餐馆、酒店、零售店、水疗中心等线下商家。主要标签有反馈收集、评论、AI、在线声誉等。

　　Shape 是一款利用人工智能探索数据的工具。它可以回答数据问题，并提供数据分析和可视化功能。Shape 支持复杂的 SQL 查询和数据堆栈集成。它以智能的方式解释问题，并提供详细的答案。Shape 还可以与 Slack 集成，让您通过 Slackbot 快速获取答案。

　　ScriboWriter 是一款集成了 100 多个预设邮件回复的 AI 邮件写手和内容生成器。无论是员工入职培训邮件、销售和营销邮件，还是与供应商、产品培训、网络问题相关的邮件，ScriboWriter 都能帮助您节省时间和精力，让您专注于真正重要的事情。此外，ScriboWriter 还可以为您的网站和博客生成 1000 多篇新鲜有趣的内容，让您的内容始终保持新颖和引人入胜。

　　Tutur是一个使用AI提高语言学习效率的在线平台。它提供语音评估、一对一会话练习、学习进度跟踪等功能,帮助用户系统地提高语言水平。

　　GradesAI 是一款人工智能驱动的学习工具，可以生成预测性模拟考试，帮助学生准备真实考试。它还提供各种互动和吸引人的学习工具，如测验、闪存卡、摘要、数学辅导等。主要功能包括 PEG 算法生成预测性练习考试、用户友好的仪表板跟踪进度、智能闪存卡帮助记忆要点、数学向导解释复杂方程、实时消息支持等。适合各年级学生使用，提高学习效率，取得更好成绩。

　　BoldDesk 是一款云端的现代化客户服务软件，可用于组织支持请求、与客户和团队合作、自动化重复任务，提升整体客户体验。它能加快支持响应时间、节省自动化工作时间、定制和重新品牌以适应您的业务、替代传统的基于邮件的支持、提高客户满意度、利用内置分析功能做出明智决策、在一个地方管理所有客户、无缝集成您喜爱的工具、提高支持人员的工作效率、避免安装和维护的麻烦、确保安全性和合规性、拥有现代直观的用户界面。

　　Local Falcon是一款多功能的本地排名追踪工具，以直观的地理网格地图格式提供本地搜索排名的鸟瞰视图。它提供Local SEO性能的分享度（SoLV）指标，基于本地SEO的最终目标，即在给定扫描半径内您的列表显示频率如何。SoLV越大，您的本地搜索可见性就越大。Local Falcon还提供100个免费积分供您尝试。它通过跟踪竞争对手，了解本地SEO表现，帮助您优化本地排名，并监控竞争对手，为您的业务长期成功提供必要的支持。

　　Imagen 2 是我们最先进的文本到图像扩散技术，可生成与用户提示密切对齐且一致的高质量逼真图像。它通过使用训练数据的自然分布生成更加逼真的图像，而不是采用预先编程的风格。Imagen 2 强大的文本到图像技术通过 Google Cloud Vertex AI 的 Imagen API 为开发者和云客户提供支持。Google Arts and Culture 团队还在其文化标志实验中部署了我们的 Imagen 2 技术，使用户可以通过 Google AI 探索、学习和测试其文化知识。

　　Qualli 是一款针对移动应用的反馈收集工具。通过直观的调查问。

上一篇: 中国平头车加宽型驾驶室数据监测报告

下一篇: 政法_中国滨州网_滨州新闻网_中国山东网频道