大家好,欢迎来到本期AI前沿速报。本期我们将带您了解英伟达推出的大模型加速包,特斯拉FSD V12的诞生过程,以及阿里巴巴CEO张勇卸任等重要新闻。同时,我们也关注到了AI在法律、化学、无人驾驶等领域的最新应用。希望这一些信息能帮大家更好地理解AI的发展的新趋势。请大家关注、点赞、转发这篇内容,让更多的人了解AI的日新月异变化。
英伟达推出了TensorRT-LLM优化程序,能加速大模型的推理速度。通过与多家AI公司合作,英伟达实现了对大模型的硬件加速。优化后的H100在跑Llama 2和GPT-J-6B模型时,推理速度分别是A100的4.6倍和8倍。TensorRT还提供了开源的模块化Python API,方便开发者定制优化方案。此外,TensorRT还优化了多节点协同工作方式、动态批处理技术和精度转换等,进一步提升了推理速度。
2. 【特斯拉FSD V12如何诞生?马斯克:大屏实时显示无干预里程数、员工每解决一个问题都要敲锣】
特斯拉FSD V12是通过一系列分析数十亿帧人类驾驶视频自学驾驶的。特斯拉每天从车队中获取约1600亿帧视频用于训练,但只有不到1%的视频是有用的。马斯克设立了一些特别的管理办法,如实时显示无干预里程数的大屏和员工每解决一个问题都要敲锣。FSD V12已完成了1000万个视频分析。马斯克相信未来是通过这种方法来实现无人驾驶,但监督管理的机构需要仔细考虑是否允许无人驾驶汽车篡改交通规则。
3. 【阿里巴巴CEO张勇正式卸任,蔡崇信和吴泳铭接任集团董事长和CEO】
阿里巴巴宣布,原集团CEO张勇正式卸任,同时辞去阿里云董事长和CEO职务。蔡崇信和吴泳铭分别出任集团董事长和集团CEO。阿里方面表示,将投资10亿美元支持张勇设立面向未来的科学基金,并授予他阿里巴巴史上第一个“功勋阿里人”荣誉称号。这次权力交接是阿里巴巴史上最大的组织变革之一,将对公司未来发展产生重要影响。
9月8日,芯片行业年度嘉年华“2023新思科技开发者大会”在上海成功举办。大会以“远·见”为主题,通过高峰论坛和行业技术论坛,与科技行业领袖和开发者们一同探讨科学技术创新和多重技术领域的未来发展。会上,新思科技提出了人才教育培训和绿色科学技术创新的建议,并分享了在芯片开发中应对软件复杂性、系统复杂性、能效、信息安全和功能安全等挑战的解决方案。同时,与会嘉宾还就AI和大模型等新兴技术的机遇与挑战展开深入探讨。大会还特别为青少年打造了科普特展和实验室,鼓励年轻一代参与科技创新。
研究人员发现,在Transformer设计中,尤其是在解码器层中,Feed Forward Network(FFN)存在冗余问题。通过删除解码器层中的FFN,并在编码器层中使用一个共享的FFN,可以显著减少模型的参数数量,而准确性只有轻微下降。此举不仅减轻了模型的计算负担,还提高了其在各种自然语言处理应用中的效果和适用性。这项研究为优化Transformer架构提供了新的思路。
根据美国研究机构Equilar的统计,英伟达的黄仁勋成为全世界智能汽车CEO薪酬最高的人,去年总薪酬达到5.06亿美元。而特斯拉的马斯克去年的收入为0元,纯靠股权激励计划。榜单中供应商CEO的薪酬普遍较高,而主机厂CEO的薪酬差距最大。在中国车企中,零跑汽车的朱江明成为总薪酬最高的CEO,达到5636.1万。整体看来,智能车相关企业CEO的薪资受到环境经济水平和市场规模的影响。
据《华尔街日报》报道,Meta正在购买AI训练芯片并建设数据中心,以创建一款更强大的聊天机器人,希望它能与OpenAI的GPT-4一样复杂。据悉,该公司计划在2024年初开始训练这款新的大型语言模型,CEO马克·扎克伯格明显希望再次允许公司使用它创建AI工具。Meta正在加强基础设施,不再依赖微软的Azure云平台来训练新的聊天机器人。该公司今年早一点的时候组建了一个团队来构建这个模型,目标是加快创建能够模拟人类表情的AI工具的速度。Meta在生成式AI领域面临激烈竞争,但他们似乎已经在这方面取得了一些进展,例如正在测试Instagram聊天机器人和即将推出的AI“人格”。同时,苹果、谷歌、微软和亚马逊等公司也在不同程度上加大了在生成式AI领域的投入。
8. 【NOLO创始人张道宁:VR和智能戒指组合将成VR 3.0时代的主要交互方式】
NOLO创始人张道宁表示,未来VR头显的交互方式将会发生改变,小型化设备如眼镜和戒指的组合形式,将成为VR 3.0的主要交互方式,为用户更好的提供轻便化的交互体验。他认为智能戒指在VR中将发挥优势,如在VR里开会操作三维模型、钓鱼、打牌等场景,智能戒指将会发挥及其重要的作用。此外,NOLO还致力于打造云化VR领域的“google play”,期望成为应用数量最丰富的商店。
9. 【中国研究人员开发出新的深度学习模型GLCNN,有助于预测催化剂的工作效果】
中国浙江大学的研究人员开发了一种名为GLCNN的特殊程序,能够在一定程度上帮助研究人员更好地理解催化剂在表面上的化学反应细节。GLCNN可以将表面和分子附着点转化为简单的网格和数字列表,从而预测分子在表面上的附着情况。该模型在预测催化剂的工作效果方面表现出色,能够更准确地预测催化剂的性质和形状。这一研究有助于提高计算机在化学领域的预测能力,为设计新的催化剂提供帮助。
SceNeRFlow是一种新的AI方法,可以生成时间一致的NeRF(神经辐射场)。它能够从多视角视频中重建一般的非刚性场景,并实现流畅的时间变化。SceNeRFlow通过建立时间不变的几何模型来解决场景中的对应关系问题,并使用后向变形建模技术处理大幅度的非刚性运动。这一突破性的方法将理论与实践相结合,为场景的重建提供了更精细的描绘。
尽管AI的不确定性和潜在危害引发了争议,但企业慢慢的开始使用AI聊天机器人和AI驱动的流程。因此,企业要自我监管AI的发展,以解决AI的不可预测性和对终端用户的潜在危害。企业要选择合适的技术,并培训团队以预测和减轻风险。此外,企业和技术领导者需要对使用的数据集和语言模型进行可见性和监督,以及风险评估、审批、审计等。尽管政府正在制定AI的伦理使用规则,但企业不能等待,必须立即开始风险管理。
LexisNexis是一家提供法律软件的公司,他们看到了AI在帮助律师减少繁琐法律工作方面的潜力。他们计划将类似ChatGPT的功能添加到他们的法律工具箱中,以帮助律师更高效地撰写简要和查找引用。这一举措旨在解决AI在法律领域中也许会出现的问题,例如引用虚假案例。LexisNexis的首席技术官Jeff Reihl表示,AI技术的发展为生成文本和对话功能提供了新的机会。
13. 【微软研究人员开发出一种将化学家的见解与AI模型相结合的单步预测反合成方法】
微软研究人员开发了一种新的方法,可以在单个步骤中预测反合成过程。他们使用深度神经网络将反合成分析转化为机器翻译问题,并提取有机合成中的共享子结构。与以往的模型相比,该方法在反合成预测中表现出更高的准确性。这一研究为读者们揭示了反合成预测和相关研究的多学科领域的魅力。
14. 【外滩大会探讨科技两面性,蚂蚁集团彭翼捷:好科技应该尊重多元、尊重包容】
在外滩大会科技与可持续发展未来分论坛上,蚂蚁集团首席可持续发展官彭翼捷表示,科技发展带来的两面性问题不容忽视。她提到了科技在老年人打车困难等方面的负面影响。为了释放技术发展的积极一面,蚂蚁集团成立了科技伦理委员会,并通过自研技术降低碳排放量。彭翼捷强调,好的科技应该尊重多元和包容,这才是社会进步的线. 【理想汽车智能驾驶产品负责人赵哲伦:高速NOA将成为智能驾驶刚需】
理想汽车的智能驾驶产品负责人赵哲伦表示,高速NOA将成为智能驾驶方面的第一个刚需,具备城市NOA能力的车型在高速NOA的能力表现上将实现降维打击。他还表示,高速NOA的成本依然较高,实现质变需要100亿公里的训练里程。
香港城市大学的研究人员开发了一种名为QCNet的AI系统,用于改进无人驾驶汽车中车辆和行人的运动预测。该模型能够实时工作,并提供现有模型的局限性。它依赖于相对时空定位的概念,能够理解交通规则和与他人的互动。研究人员还使用了大量的自动驾驶数据和高清地图进行模型评估。测试结果为,该模型的速度和准确性都十分好。研究人员表示,他们仍在努力将该模型应用于预测人类行为,并进一步提升预测和无人驾驶效率。这是汽车史上最重要的研究之一。
康奈尔大学和特拉维夫大学的研究人员开发了一种名为“Doppelgangers”的新数据集,用于帮助计算机视觉系统区分相似但不同的结构图像。他们利用现有的图像注释从维基共享资源图像数据库中自动生成了一组标记的图像对。研究人员还设计了一种专门的网络架构,通过局部特征和2D对应来提高视觉区分任务的性能。该方法在测试中表现出色,可提升计算机视觉系统在3D重建和视觉区分任务中的可靠性和精度。
GPTZero、ZeroGPT、ZeroGPT Detector、ContentDetector.AI、Content at Scale AI、AI Checker Tool、GPTSafe、Winston AI、Originality.AI和InterestedinAI是一些能够在一定程度上帮助用户检测AI生成内容的工具。它们使用先进的算法和人工智能技术来识别AI生成的文本,并提供准确的分析结果。这些工具能够在一定程度上帮助教育工作者、作家、学生和其他用户识别AI生成的文本,以确保内容的原创性和质量。这些工具的使用简单方便,适用于多种语言和应用场景。