在SAT和律师考试中表现优异
微软计划将其搭载至必应搜索引擎
但仍存在无法识别虚假信息的局限
开发出人工智能(AI)聊天机器人“ChatGPT”的OpenAI于14日(当地时间)推出了比以往模型更接近人类水平性能的人工智能工具“GPT‑4”。
据主要海外媒体报道,OpenAI当天发布了大规模人工智能语言模型(大型语言模型,LLM)GPT‑4。
OpenAI方面称,GPT‑4在美国模拟律师资格考试中取得了百分位90%、在大学入学考试SAT中取得了89%的成绩,展现出接近人类水平的性能。此前搭载语言模型GPT‑3.5的人工智能聊天机器人“ChatGPT”在模拟律师考试中的成绩仅为百分位10%。
虽然OpenAI方面并未公开具体数字,但专家推算,GPT‑4中相当于人脑突触的参数数量高达100万亿个。相比之下,GPT‑3.5所采用的参数数量为1750亿个,可见性能大幅提升。OpenAI表示,出于安全以及与竞争对手相关问题等考虑,将不公开语言模型所使用的硬件、模型训练数据等技术细节。
不过,OpenAI解释称,为训练GPT‑4模型,使用了微软(Microsoft)的云服务Azure。微软计划在其新搜索引擎必应(Bing)中搭载GPT‑4。
但经确认,GPT‑4同样存在与前代模型类似的局限,即无法区分虚假信息。OpenAI方面表示,或许正是意识到这一问题,在GPT‑4发布前进行了压力测试,以查找问题。搭载GPT‑3.5的ChatGPT同样被指出,会将虚假内容当作事实来呈现,可能成为扩散假信息的渠道。
他们表示,“GPT‑4可能生成带有偏见的仇恨言论等有害内容,也可能提供开发化学武器等违法行为所需的信息”,对此表示担忧。
关于GPT‑4是否能够在无人类干预的情况下凭借自由意志行动,OpenAI方面表示:“我们测试了人工智能能否自主行动,但目前看来还做不到这一点。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。