设为首页 加入收藏
  • 首页
  • 时尚
  • 休闲
  • 热门资讯
  • 热点
  • 娱乐
  • 焦点
  • 当前位置:首页 > 综合 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

    财经观察:提升人机交互效率 多模态大模型易用性进一步推进

    发布时间:2025-07-28 09:13:49 来源:临沧市某某酸菜鱼壹 作者:休闲

    人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态萍乡市某某建筑科技厂问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

    北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经萍乡市某某建筑科技厂音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

    一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

    模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

    作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

    发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

    米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

    此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

    国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

    多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

    米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

    据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

    OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

    • 上一篇:爱泼斯坦案再惹纠纷 美国会众议院提前放假
    • 下一篇:教育家精神万里行|崔晓阳:脚踏泥土 治学育人

      相关文章

    • 职业教育也能通向大学?林同学用实际行动证明了一切
    • 小朋友们,暑假也要记得好好吃饭哦
    • 以军轰炸加沙中部一联合国机构学校 致13人死亡
    • 英国首相苏纳克承认败选
    • 刘德华道歉
    • 先丢一盘后逆转,德约科维奇第16次晋级温网男单16强
    • 【天文地理】高考地理中的地球运动!高考地理中的太阳视运动
    • 湖南通报洞庭湖决口险情:垸内水深5米
    • 北京市昌平区回龙观第二小学打造学生欢乐乐园
    • 改革派当选,伊朗新任总统是何许人?一图了解

      • 百亿传销大案告破,境内90余万账户涉案
      • 人工智能如何加速创意产业发展?|钛媒体AGI
      • 苏丹新一轮霍乱疫情已致370人死亡
      • 新研究显示:中国湖泊有机碳总储量大幅增加
      • 中新健康丨女子十年体检“未见异常”到癌症晚期?爱康国宾回应
      • 中发系银行保险双承压力,亿联银行净利润大跌70%
      • 卡尼萨雷斯:库尔图瓦是门将位置上的马拉多纳、梅西、C罗
      • 上海多个小区加装电梯工程出现“严重拖延”:是代建公司资金紧张所致?
      • 以军发言人称未对叙利亚边界混乱局面做好准备
      • 甲骨文创始人埃里森:人工智能终有一天会追踪你的一举一动

        随便看看

      • 俄称击落百架乌无人机 乌方通报遭俄大规模空袭
      • 9月18日外媒科学网站摘要:如何能发现氢原子大小黑洞穿过太阳系
      • 华为的三折叠手机,到底难在哪?
      • 涉19省份重磅规划:长江流域将建成黄金经济带
      • 2025年山东高考普通类常规批第一次(本科)投档表公布!
      • 最多融资1000亿美元!贝莱德和微软联手建AI基础设施
      • 斯里兰卡全岛实行宵禁
      • 美国明尼苏达州发生枪击事件 致2死3伤
      • 安理会召开紧急会议 柬埔寨呼吁和平解决柬泰冲突
      • 华为的三折叠手机,到底难在哪?
      hgtkbf.com 洞庭湖一线堤防决口预计在7月9日12时前完成封堵 年纪大了就会“弯腰驼背”?当心背后的疾病 全国夏粮已收96.2%,夏播粮食已播83.1% 哈马斯谴责以军袭击加沙中部难民营学校 赵今麦《度华年》热度第一,还有更大的爆款剧在后面,期待值拉满 马斯克:“星舰”将在4周内再次试飞 四川一卫生院职工给多人注射假宫颈癌疫苗:用生理盐水冒充 警方已立案 申花6球大胜泰山 创造两队交锋最大分差 英格兰点球5比3淘汰瑞士,总比分6比4晋级四强 锅包肉办公室来了,宫保鸡丁办公室还远吗?
      • Copyright © 2025 Powered by 财经观察:提升人机交互效率 多模态大模型易用性进一步推进,临沧市某某酸菜鱼壹   sitemap