ChatGPTにて「GPT-4o」モデルが公開!
~AIは実務に耐えうるのか~

5月13日、アメリカにてOpenAIが新たな大規模言語モデル「GPT-4o」を発表しました。

今回は筆者が実際に「GPT-4o」を使用した中で、新しい大規模言語モデルが今までとどう違うのか

どのような仕事ができるのかについて検証致しました。是非、この機会にAI導入をご検討いただければ幸いです。

今までとの違い

・応答速度が圧倒的
 ➡複雑な命令だと、今までは応答時間が長すぎたためにエラーが発生することがありました。 
今回のアップデートでは上記課題を解決。快適なユーザー体験を提供しています。

・認識機能の向上
 ➡画像や音声の認識機能が向上し、英語のみに対応していたOCR機能が日本語に対応しました。
また、動画を読み込むこともでき、インプット資料の幅が増えました。
(※読み込みのみ。動画生成に関してはOpenAIが2月15日に動画生成AI【Sora】の発表を行ったが未実装。)

・一部機能が無料化
 ➡無料版を使用しているユーザーにも一部機能を開放しました。

仕事にAIを導入する上で、重要になる項目は上記となりますが、上記以外にもAPI制限の変更などといった違いがあります。

どのような実務に耐えうるか

新モデルでは回答速度が大幅に上昇し、精度も僅かばかりですが向上しています。そのためか
思い通りの回答を生成してもらう為に試行錯誤する際、ストレスが発生しがちでしたが、大幅に緩和した印象があります。
既にAIに代替されつつある「ライティング業務」「簡易調査」といった業務も、実は回答が思い通りに生成されずストレスとなり
結果として「自分で行ったほうが早い」と導入を諦めた事例が数多くありますが、そういった方も再度の導入を検討する良い機会ではないかと考えます。

また、認識機能全般が向上しリアルタイムの会話が可能になったことで、秘書と呼ばれる方々の一部業務が代替可能になったように思われます。
実際に外部サービスと接続すれば、今までも下記の業務が可能でした。
・音声での指示でカレンダーを変更する
・音声での指示でメールの下書き作成する etc…
しかしながら現実問題としてレスポンスの遅さからあまり実用的ではありませんでした。
新モデルは上記問題を解決しただけでなく相槌も実装。人間との会話と非常に近い形でコミュニケーションを行えます。
今までは人間らしくない、どこか使いにくいと感じていた方も今一度お試しいただくことで以前との違いを実感できるかと存じます。

最後に

今回発表された「GPT-4o」は、Googleが発表した「Gemini Pro」と遜色ない性能であり、現在の最先端の機能を持っています。
自分用にカスタマイズできたり、様々なファイルを扱えるという点では「Gemini Pro」よりも活用の幅が広がると考えています。
GPTは既に様々なサービスに組み込まれているため、各所が開発したAIツールの精度向上が見込まれるでしょう。
また、「GPT-4o」は無料版でも公開されています。そのため、今までは金銭的事由から利用を控えていた学生等も最先端の環境へ
参加してくることとなります。これからユーザーが増えることでAI技術や応用方法はますます進歩していくでしょう。

私たちコンサルタントは、お客様の業務効率化に貢献すべく、日々進歩するAIの最新情報を常にチェックしております。
業務の効率化や人件費削減等でお困りの場合は是非ともご連絡ください。