
机器创建者的原始心脏:Zhang Qian,在Trans推出八年后,在模型的领域占据了统治之后,Google创建了它,但也显示了一个新开始的迹象。上个月,Google产品领导者洛根·基尔帕特里克(Logan Kilpatrick)指出了现有护理机制的局限性,Google推出了新的建筑MOR。这些行动表明,AI领域的“建筑创新”已成为广泛的共识。在最近的世界人工智能会议上也可以看到这种趋势。而且,即使是国家公司的实践也比Google的变化更彻底。该视频的视频配备了多模型离线。该模型只有3B大小,但是在开发直到最后,对话和延迟的效果几乎都可以与云中执行的更大模型相提并论,并具有Mmultimodal特征,例如“ See See,list,Think,Think Think,Think,Think Think”。重要的是要强调它不是基于变形金刚,而是基于Yan 2.0的预览是National Rockai创业公司提出的不是建筑。该体系结构可以在具有非常有限的计算机功率(例如Raspberry Pi)的设备中搁置,因为它在模型推断过程中大大降低了计算的复杂性。此外,与其他在设备侧面执行的“基于大云模型的小参数版本”不同,该模型具有某些本机内存功能,可以在执行推理任务时将内存合并到其自己的参数中。换句话说,当您与其他大型模型交谈时,每次打开一个新窗口时,该模型都不记得您以前所说的内容。他们每天开会,但每天都是“第一次会议”。相反,随着时间的推移,基于YAN体系结构的模型可以变得越来越可以理解,并根据此信息回答所有问题。这是大多数基于变压器的基于云的模型S无法提及通过修剪,蒸馏或其他媒体来破坏学习能力的“小型模型”。为什么Russai在变压器上造成了如此根本的变化?你想做吗?这些变化是如何实现的?实施AGI的重要性是什么?与Rockai的创始团队进行了深入的对话后,我们收到了宝贵的答案。变压器很长一段时间以来一直很受欢迎,那么为什么Rockai需要“开始新工作”? Rockai对变形金刚的挑战并未开始今年。实际上,在2024年1月,我们两年前推出了Yan Architecture 1.0版本。众所周知,变压器存在诸如“ datawalls”和“同步取决于能量的问题”。一方面,大型现有模型是由大数据引起的,但是随着该路线变得越来越困难,因为它变得增加了实施,因此很难再次更新此模型,因为逆转录量所需的计算量并不是这样的计算量。普通团队可以支持。Shecha和其他操作甚至可以破坏模型再次出现的模型。通过这种方式,设备侧面的变压器模型变成了“静态”模型,并且在实现模型时会阻止智能级别。为了从根本上解决这些问题,Rockai从一开始就采取了非常彻底的变化途径,调查了从0到1的非转换YAN架构。更值得称赞的是,他们不仅快速找到了有效的技术路线,而且成功地为具有有限计算机功率的设备实施了商业实施。 YAN 2.0的预览:世界上第一个具有“本地记忆”的大型模型。下图显示了YAN 2.0和其他Archivistos的先前观点,这显示了比较该技术的效果和性能的结果。由此,无论是与Tran ModelsFormator的主要模型相比,还是与非新一代模型相比-Convert Architecture,Yan 2.0的先前观点在多个重要指标(例如生成,理解和推理)中具有良好的优势,并且完全证明了Yan架构在性能/参数比率(即效率)上的巨大优势。当然,这不是一个中心的最高点。毕竟,我们看到了YAN 1.3的令人惊讶的计算机效率。这次的亮点是“内存”。无论是新的文章,新产品还是公众讨论,我们都会发现“记忆”已成为重点:人们认为,当前LLM的关键不便和在AI应用程序的下一轮商业化中的进步。想象一下,经过多年的Lavebu可以与您交谈并拥有独家记忆的Lavebu,在情感上更加紧密。但是,从技术路线的角度来看,工厂现在主要使用“互补”方法(例如搜索引擎和与长上下文的重叠延误)来帮助发展更大的模型。Rockai对这种方法并不乐观。首先,我们将信息作为顺序和“时间”的真实概念进行处理(这对于实际学习作为时间很重要)。其次,无法实现真正的自定义。 “回顾人类社会,每个人都有独特的回忆。人们的差异来自不同的回忆和经验。您在云中基本上的模型,当前的自定义,只能通过获得聊天记录来提供背景。这种情况是,我们认为,只有在将视频记忆纳入模型中,才能更改视频内存的功能。然后Yan 2.0预览选择了另一条路线。模型理解的信息在神经元网络的重量中被内在化,并成为模型本身的一部分。通过不同的“神经元网络记忆单元”,这种早期学习的人为来深度学习。学习,结合私处保护的好处最后和实时响应和实时响应。该团队得到了多年的支持。我们认为AI是普遍的,可以确保学习“个人”智力变得足够聪明。这也反映在最近对行业的“自我变量AI”的讨论中。但是,Rockai强调,这种自我进化应该发生在“单个”设备中,而不是基于大云的模型。第三,一旦“个人”变得足够聪明,就会出现由群体智能形成的网络,例如建立如此出色的文明的人类社会。 Rockai认为,团体智能是通用人工智能(AGI)的重要途径。这些概念是在执行过程中实施的,并构成了Rockai当前的主要任务:“世界上所有的the夫都有自己的情报。”此任务听起来像“ Endanese Intelligence”。Mophose认为,他们所追求的实际上是“排除在线智能”,仅使用本地设备的计算机功能,并且不需要互联网作为使用“最终云集成”的许多设备。此外,此外,这种离线模式允许模型实现独立学习而不是在实现过程中被阻止。具有这种学习能力的模型,我们可以从小就可以理解它的潜在学习,它的能力不如30年的博士学位,但是随着稍后的成长,它会变得更强壮。但是,由于能够记住的能力和自主学习的能力,硬件的长期价值开始出现,智能和进化技能的程度成为差异化硬件的销售点。此外,这种“增长”还提供了群体智能的可能性。只有当每个设备具有独立学习的能力时,您才能真正执行知识交换最终,协作进化最终超越了单个智能的简单添加,这也是洛克的最终愿景。 “问题”:Rockai使“困难但正确”。回顾近年来的研发过程,Rockai可以清楚地感觉到外界对他们选择的技术路线的态度的变化。几年前,当开始新组情报开发和新建筑时,外界的反应更加新颖,令人困惑,令人怀疑。本地记忆功能的这种可视化使任何人都可以看到Lokkai的奇异性。它们没有在简单的训练模型和参数积累中保持,而是遵循“难度和精度”的技术途径,该途径将大型模型的功能限制重新定义为“内存”(例如核),从而带来了令人难以置信的用户体验。 Rockai的CMO,Zou Jiasi说,选择这个TEChnical路线会使它在整个WAIC中看起来非常独特。许多需要实施功能和走私记忆的硬件制造商来了解技术解决方案。这些供应商还尝试了基于反式的模型,但是这种体验显然无法满足他们的需求。此外,一些制造商在Rockai的Cooperar得出了结论。没有Yan-Keytechnology的变革性通过AI硬件市场传播。几年前,Rockai的决定非常积极,并且必须承认,他还对科学研究和营销结果感到了外部怀疑。杨华将来说,他们将继续做这一“困难但正确”。即使为了获得更有效的自主学习能力,它们也不断挑战重传载算法,即人工智能的基础。当前的解决方案完成了索引测试和小型数据培训的收敛验证,这些验证证明了s解决方案的基本可行性。在许多新的AI公司中,这种未来的观点和阻力遵循其自身的道路与前卫 - garde实验室的发展非常相似。毕竟,当伊利亚忙碌的规模繁忙时,比例方法尚未达成共识。从Rockai那里,我们看到了宝贵的“长期”精神:在冲动的商业环境中,我们仍然愿意花几年的时间来克服潜在的技术问题并研究那些“不切实际”的技术概念。创新是孤独的,我们希望Lokkai和更多的探险家沿途移动。