大模型日报
2024-06-11
大模型资讯
- 摘要: 研究人员在最近的一项研究中,利用GPT-4自主工作的小组成功攻破了超过一半的测试网站。这表明GPT-4在自动化黑客攻击中的潜力和安全风险。
- 摘要: 苹果开发者大会今日开幕,预计将展示iOS 18的新功能,包括Siri AI和Apple Intelligence等。
- 摘要: ChatGPT和其他大型语言模型的公开发布,使全球开发者能够开始实验这些技术,推动了开源通用机器人对象操控模型的推出。
- 摘要: 研究表明,无需矩阵乘法的语言模型在十亿参数规模上依然能够保持顶级性能。这一发现可能改变神经网络的设计方式,尤其是在GPU优化的背景下。
- 摘要: Meta公司希望使用隐私意识强烈的欧洲用户数据来训练其人工智能模型,但同时也面临隐私问题的挑战。
- 摘要: 俄罗斯科技公司Yandex宣布已向公众开放其用于人工智能研究的大型语言模型。这一举措将促进AI研究的进一步发展,并为相关领域的研究人员提供新的工具和资源。
- 摘要: GNN-RAG结合图神经网络的知识图谱处理能力和大型语言模型的语言能力,开辟了新的可能性。
- 摘要: 研究人员借鉴博弈论的思想,改进大型语言模型,使其更加正确、高效和一致。这一方法有望提升人工智能的可靠性和性能。
- 摘要: 阿联酋在人工智能领域迈出重要步伐,致力于成为全球AI中心。通过推出先进的语言模型,阿联酋展示了其在技术创新和应用方面的领导力,进一步巩固其在国际科技界的重要地位。
- 摘要: 公司正在开发能够相互交流和交换信息的AI工具。AI竞赛的下一步发展不再是构建大型语言模型,而是打造能够沟通的AI工具。
大模型产品
- 摘要: Elai通过视频测验、分支和热点,让员工在学习中互动,提升参与度和记忆效果,打造沉浸式培训体验。
- 摘要: MindMatrix是一款AI思维导图生成工具,帮助内容创作者和教育者轻松创建、组织和可视化复杂主题。
- 摘要: Active Recall帮助你总结在线内容,构建知识图谱,并根据学习曲线定期提醒,确保你记住重要信息。
- 摘要: Luxi.Ai利用先进AI和扩散模型,重新定义时尚行业,为用户和企业提供终极购物体验。
- 摘要: 使用Hadana AI设计您的理想行程,优化旅行体验,探索新冒险。Hadana AI是您完美的旅行伴侣。
- 摘要: Afforai是一款AI驱动的参考文献管理器,帮助你随时随地管理论文和研究。限时在AppSumo提供终身优惠。
- 摘要: 一键生成吸引人的照片标题,节省每日发帖时间,专注于拍摄好照片,我们来提供完美标题。
- 摘要: Rivit是一款AI驱动的全能平台,帮助小企业自动化对话、管理工单、收集反馈、识别趋势,提高客户满意度。
- 摘要: SmartEReply是一款AI浏览器扩展,支持Chrome、Firefox和Edge。自动生成互动帖子,个性化回复,提升个人资料曝光率,支持多语言全球连接。
- 摘要: Luna Ring是一款高精度智能戒指,全天候静音监测睡眠、心脏健康和活动数据,帮助你了解自身状态,提高效率。
大模型论文
- 摘要: 3D-GRAND是一个包含40,087个家庭场景和620万语言指令的大规模数据集,显著提高了3D-LLMs的基础能力并减少了幻觉。
- 摘要: 本文研究了多模态大模型的参数高效微调方法,通过对四种PEFT方法进行实证分析,发现adapter方法效果最佳。
- 摘要: 本文提出了一种动态语义等价视觉分词器SeTok,通过动态聚类算法将视觉特征分组为语义单元,显著提升多模态大语言模型的性能。
- 摘要: 本文提出了一种新型大规模图生成模型(LGGM),通过在多领域大规模图数据集上预训练,实现了零样本生成和文本生成图的能力,并提供了代码和数据集。
- 摘要: LINX系统利用自然语言接口和大语言模型,实现个性化数据探索,显著优于现有解决方案。
- 摘要: 多头RAG通过利用Transformer的多头注意力层激活来检索多方面文档,提升复杂查询的检索准确性,效果显著。
- 摘要: 研究比较了四个大语言模型与人类在情感识别和同理心回应上的表现,发现GPT-4表现最佳。
- 摘要: 研究评估在缺失和矛盾条件下的数学推理鲁棒性,提出PMC基准和SLP方法,实验显示SLP方法优于现有方法。
- 摘要: 本文评估了语言模型在编程反馈生成中的质量、成本、时间和数据隐私等性能,展示了在浏览器内推理的有效性。
- 摘要: 本文通过CP分解参数化二阶RNN(CPRNN),分析其模型容量,并在Penn Treebank数据集上验证其性能优于传统RNN和其他变体。
大模型开源项目
- 摘要: Xenova项目实现了在浏览器中直接运行最先进的机器学习模型,无需服务器支持,使用JavaScript编写。
- 摘要: 提供ResNet、YOLO、DETR等模型教程,涵盖最新的Grounding DINO和SAM模型,使用Jupyter Notebook编写。
- 摘要: k2-fsa项目使用Kaldi和onnxruntime实现离线语音识别、语音合成和说话人识别,支持多种平台和编程语言。
- 摘要: Karpathy项目提供一个用Python编写的简易且快速的仓库,用于训练和微调中型GPT模型。
- 摘要: LeRobot是一个基于Pytorch的项目,旨在实现现实世界中的机器人端到端学习,使用Python编写。