【国金证券】文心一言、GPT3.5及GPT-4的应用测评对比(1).pdf

【国金证券】文心一言、GPT3.5及GPT-4的应用测评对比(1).pdf

本文是国金证券的计算机行业研究报告,主要对文心一言、GPT-3.5和GPT-4这三大模型在不同应用场景下的表现进行了测评对比。

核心观点:

  • 三大模型在常识问答、文字生成等领域表现出色,但在逻辑推理、数学计算和代码生成方面仍有提升空间。
  • 文心一言在图像创作和归纳总结方面表现较好,但文心在逻辑推理方面略逊于GPT-3.5和GPT-4。
  • GPT-4在文本创作方面细节更丰富,但图像生成功能暂未开放。
  • 随着百度文心及OpenAI生态的增长,各模型性能有望进一步优化。
  • 建议关注在AI领域持续布局且有成熟应用场景的公司。

测评内容及结果:

报告从多个维度对三大模型进行测评,主要包括:

  1. 常识和创作: 在常识问答方面,三大模型表现均正确。在文字创作方面,文心一言分词有待提高,但总体体现正面价值观。GPT-4的创作细节更丰富。文心一言图像生成能力较好。
  2. 归纳和推理: 文心在演绎推理、逻辑推理方面略逊于GPT系列,但在归纳总结方面表现较好。GPT-4的逻辑推理能力相对较强。
  3. 数学和代码: GPT-3.5 在数学计算方面表现更好,但代码生成方面,模型均有改进空间。
  4. 现实应用场景测试:
    • AI生活助手:三大模型均能提供正确建议。
    • 售后客服:三大模型均能完成任务,GPT-3.5表现更优。
    • 办公场景助手:GPT-4表述更丰富,GPT-3.5文言文表达惊艳。
    • 产品推荐:文心表现较好。
    • 诗词理解:文心表现最好。

投资建议:

报告建议关注在人工智能领域持续布局且拥有成熟应用场景的公司,如万兴科技、汉得信息、凌志软件、同花顺、金山办公。

风险提示:

报告提示了海外基础软硬件使用受限、应用落地不及预期、行业竞争加剧、以及测评问题有限可能导致的偏差等风险。

在线阅读 下载完整报告 | 6.49 MB | 32页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告