大模型日报2024-06-11

大模型日报

 

2024-06-11

 

大模型资讯

 

  1. GPT-4 自动攻破安全漏洞

 

  • 摘要: 研究人员在最近的一项研究中,利用GPT-4自主工作的小组成功攻破了超过一半的测试网站。这表明GPT-4在自动化黑客攻击中的潜力和安全风险。

 

  1. iOS 18发布:Siri AI和更多新功能亮相WWDC

 

  • 摘要: 苹果开发者大会今日开幕,预计将展示iOS 18的新功能,包括Siri AI和Apple Intelligence等。

 

  1. 开源通用机器人对象操控模型发布

 

  • 摘要: ChatGPT和其他大型语言模型的公开发布,使全球开发者能够开始实验这些技术,推动了开源通用机器人对象操控模型的推出。

 

  1. 无需矩阵乘法的语言模型在十亿参数规模上保持顶级性能

 

  • 摘要: 研究表明,无需矩阵乘法的语言模型在十亿参数规模上依然能够保持顶级性能。这一发现可能改变神经网络的设计方式,尤其是在GPU优化的背景下。

 

  1. Meta计划使用欧洲用户数据训练AI模型,面临隐私问题

 

  • 摘要: Meta公司希望使用隐私意识强烈的欧洲用户数据来训练其人工智能模型,但同时也面临隐私问题的挑战。

 

  1. 俄罗斯Yandex公开AI大型语言模型

 

  • 摘要: 俄罗斯科技公司Yandex宣布已向公众开放其用于人工智能研究的大型语言模型。这一举措将促进AI研究的进一步发展,并为相关领域的研究人员提供新的工具和资源。

 

  1. 利用图神经网络提升语言模型性能

 

  • 摘要: GNN-RAG结合图神经网络的知识图谱处理能力和大型语言模型的语言能力,开辟了新的可能性。

 

  1. 博弈论助力提升AI可靠性

 

  • 摘要: 研究人员借鉴博弈论的思想,改进大型语言模型,使其更加正确、高效和一致。这一方法有望提升人工智能的可靠性和性能。

 

  1. 阿联酋引领全球AI中心雄心,推出先进语言模型

 

  • 摘要: 阿联酋在人工智能领域迈出重要步伐,致力于成为全球AI中心。通过推出先进的语言模型,阿联酋展示了其在技术创新和应用方面的领导力,进一步巩固其在国际科技界的重要地位。

 

  1. 公司开发能相互交流的AI工具

 

  • 摘要: 公司正在开发能够相互交流和交换信息的AI工具。AI竞赛的下一步发展不再是构建大型语言模型,而是打造能够沟通的AI工具。

 

大模型产品

 

  1. Elai:互动视频培训提升员工参与度

 

  • 摘要: Elai通过视频测验、分支和热点,让员工在学习中互动,提升参与度和记忆效果,打造沉浸式培训体验。

 

  1. MindMatrix: 免费AI思维导图生成器

 

  • 摘要: MindMatrix是一款AI思维导图生成工具,帮助内容创作者和教育者轻松创建、组织和可视化复杂主题。

 

  1. Active Recall: 智能知识管理工具

 

  • 摘要: Active Recall帮助你总结在线内容,构建知识图谱,并根据学习曲线定期提醒,确保你记住重要信息。

 

  1. Luxi.Ai:AI时尚助手

 

  • 摘要: Luxi.Ai利用先进AI和扩散模型,重新定义时尚行业,为用户和企业提供终极购物体验。

 

  1. Hadana.io:AI智能旅行规划助手

 

  • 摘要: 使用Hadana AI设计您的理想行程,优化旅行体验,探索新冒险。Hadana AI是您完美的旅行伴侣。

 

  1. Afforai:AI助力的文献管理工具

 

  • 摘要: Afforai是一款AI驱动的参考文献管理器,帮助你随时随地管理论文和研究。限时在AppSumo提供终身优惠。

 

  1. 智能照片标题生成器

 

  • 摘要: 一键生成吸引人的照片标题,节省每日发帖时间,专注于拍摄好照片,我们来提供完美标题。

 

  1. Rivit:小企业客服神器

 

  • 摘要: Rivit是一款AI驱动的全能平台,帮助小企业自动化对话、管理工单、收集反馈、识别趋势,提高客户满意度。

 

  1. SmartEReply: AI助力LinkedIn互动

 

  • 摘要: SmartEReply是一款AI浏览器扩展,支持Chrome、Firefox和Edge。自动生成互动帖子,个性化回复,提升个人资料曝光率,支持多语言全球连接。

 

  1. Luna智能戒指:精准监测睡眠与压力

 

  • 摘要: Luna Ring是一款高精度智能戒指,全天候静音监测睡眠、心脏健康和活动数据,帮助你了解自身状态,提高效率。

 

大模型论文

 

  1. 3D-GRAND: 提升3D-LLMs的基础与减少幻觉

 

  • 摘要: 3D-GRAND是一个包含40,087个家庭场景和620万语言指令的大规模数据集,显著提高了3D-LLMs的基础能力并减少了幻觉。

 

  1. 多模态大模型参数高效微调实证研究

 

  • 摘要: 本文研究了多模态大模型的参数高效微调方法,通过对四种PEFT方法进行实证分析,发现adapter方法效果最佳。

 

  1. 动态语义等价视觉分词器SeTok的研究

 

  • 摘要: 本文提出了一种动态语义等价视觉分词器SeTok,通过动态聚类算法将视觉特征分组为语义单元,显著提升多模态大语言模型的性能。

 

  1. 大规模图生成模型的设计与应用

 

  • 摘要: 本文提出了一种新型大规模图生成模型(LGGM),通过在多领域大规模图数据集上预训练,实现了零样本生成和文本生成图的能力,并提供了代码和数据集。

 

  1. LINX:面向目标的自动数据探索生成系统

 

  • 摘要: LINX系统利用自然语言接口和大语言模型,实现个性化数据探索,显著优于现有解决方案。

 

  1. 多头RAG:解决多方面问题的新方法

 

  • 摘要: 多头RAG通过利用Transformer的多头注意力层激活来检索多方面文档,提升复杂查询的检索准确性,效果显著。

 

  1. 大语言模型是否比人类更具同理心?

 

  • 摘要: 研究比较了四个大语言模型与人类在情感识别和同理心回应上的表现,发现GPT-4表现最佳。

 

  1. 数学推理在缺失和矛盾条件下的鲁棒性评估

 

  • 摘要: 研究评估在缺失和矛盾条件下的数学推理鲁棒性,提出PMC基准和SLP方法,实验显示SLP方法优于现有方法。

 

  1. 浏览器内推理的编程反馈生成基准

 

  • 摘要: 本文评估了语言模型在编程反馈生成中的质量、成本、时间和数据隐私等性能,展示了在浏览器内推理的有效性。

 

  1. 基于张量分解的二阶RNN研究

 

  • 摘要: 本文通过CP分解参数化二阶RNN(CPRNN),分析其模型容量,并在Penn Treebank数据集上验证其性能优于传统RNN和其他变体。

 

大模型开源项目

 

  1. Xenova:浏览器内运行AI模型

 

  • 摘要: Xenova项目实现了在浏览器中直接运行最先进的机器学习模型,无需服务器支持,使用JavaScript编写。

 

  1. SOTA计算机视觉模型教程

 

  • 摘要: 提供ResNet、YOLO、DETR等模型教程,涵盖最新的Grounding DINO和SAM模型,使用Jupyter Notebook编写。

 

  1. k2-fsa: 离线语音识别与合成

 

  • 摘要: k2-fsa项目使用Kaldi和onnxruntime实现离线语音识别、语音合成和说话人识别,支持多种平台和编程语言。

 

  1. 快速训练中型GPT的简易仓库

 

  • 摘要: Karpathy项目提供一个用Python编写的简易且快速的仓库,用于训练和微调中型GPT模型。

 

  1. LeRobot: 端到端机器人学习

 

  • 摘要: LeRobot是一个基于Pytorch的项目,旨在实现现实世界中的机器人端到端学习,使用Python编写。

相关推荐

  1. 模型日报2024-06-11

    2024-06-12 00:18:01       21 阅读
  2. 模型日报2024-06-10

    2024-06-12 00:18:01       16 阅读
  3. 模型日报2024-06-12

    2024-06-12 00:18:01       16 阅读
  4. 模型日报2024-06-13

    2024-06-12 00:18:01       18 阅读
  5. 模型日报2024-06-15

    2024-06-12 00:18:01       15 阅读
  6. 模型日报2024-06-18

    2024-06-12 00:18:01       21 阅读
  7. 模型日报2024-04-12

    2024-06-12 00:18:01       27 阅读
  8. 模型日报2024-04-13

    2024-06-12 00:18:01       25 阅读
  9. 模型日报2024-04-14

    2024-06-12 00:18:01       25 阅读
  10. 模型日报2024-04-17

    2024-06-12 00:18:01       34 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-12 00:18:01       5 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-12 00:18:01       5 阅读
  3. 在Django里面运行非项目文件

    2024-06-12 00:18:01       4 阅读
  4. Python语言-面向对象

    2024-06-12 00:18:01       7 阅读

热门阅读

  1. React@16.x(26)useContext

    2024-06-12 00:18:01       17 阅读
  2. 新视野大学英语2 词组 6.11

    2024-06-12 00:18:01       15 阅读
  3. 419.甲板上的战舰

    2024-06-12 00:18:01       10 阅读
  4. 比亚迪算法岗面试,问的贼细

    2024-06-12 00:18:01       18 阅读
  5. Python中的可变参数

    2024-06-12 00:18:01       14 阅读
  6. 问题 B: 2.左右(lr.cpp/pas)

    2024-06-12 00:18:01       20 阅读
  7. Vue小细节

    2024-06-12 00:18:01       20 阅读
  8. VPN简介

    2024-06-12 00:18:01       17 阅读