71歳の爺さんが生成AIを学ぶ

生成AIで答え合わせをしてみた(2)

目安時間:約 4分

生成AIとロボット

前回生成AIで〇×問題25問で問題と答えがあっているか別の生成AIで確認したことを伝えました。

 

今回は同じ25問ですが選択問題で問題と答えが合っているか同じように別の生成AI Google AI StudioとGeminiに問題と答えをインプットし合っているか尋ねました。

 

少し前の記事で書いたようにGoogle AI StudioとGeminiが同じGoogleから出している生成AIなので今思うと答えが似ているのもうなずけます。

 

結果は両方ともすべて選択問題が合っていると言いませんでした。それもGoogle AI StudioとGemini両方ともすべてではありませんでしたが同じ問題でNGや疑問を投げかけました。上の理由なので今なら理解できます。以下の内容は同じGoogleの系列だと知らなかった時の書いた内容なので少しの矛盾は許してください。

 

その時思ったことを出来るだけそのまま書きたかったので知った後で直すことも考えましたがそのまま行きたいと思います。

 

割と多かったのがチャットGPTで作った問題の受け取り方で答えが違ってくるという指摘です。それぞれのAIで学習してきた内容が違うせいか問題の導き出し方も少し違うようです。

 

この場合はこれが正解または疑問であるとか、チャットGPTでは答えが一つなのにこれとこれが正解などと受け取り方で変わってくるという問題が起きました。

 

そしてもう一つは一般的にはとか平均的には、のような判断がすこし苦手なようです。一般的にはこのようだと人では判断できますが、例外的にこのような場合もあるのでそれは当てはまらない、のような回答です。確かに間違がっていないとも言えるのですが部分的な例外があるとそれを指摘して正解でないといいます。

 

どちらの考え方も正解とも不正解ともいえない部分があります。それらは確認しないとそのまま使用できないので疑問な内容をネット上で2,3調べ生成AIの問題と答えが正しいのか確認しなおしました。

 

確認後最終的に問題を完成させました。

 

それらは確かに手間でしたが、1から自分で作ることを考えれば相当な時間短縮になり効率的でした。

 

前回にも書きましたが生成AIは必ずしも正しいとは限らないので問題を作ってもらうのは良いが、私の知識以外やあやふやな部分はどのようにして確かめようかなと悩んでいたので、ほかの生成AIに確かめさせると考えたのは正解でした。

 

比較して違う部分や指摘のあった部分だけ調べればほぼ正解なので相当時間短縮が出来ました。

 

ほぼ正解と書いたのはどの生成AIもバックデータが同一であれば間違えることもあるのではないかと思ったからです。でも膨大なデータの中で間違った一つのデータだけしか存在しないのは考えにくいことです。

 

関連データを総合的に判断していると思うのですべての生成AIが間違った1つの答えしか出せないとは考えにくいです。

 

以上、問題を作ってもらい確認した方法を記事にしてみました。参考になれば幸いです。

この記事に関連する記事一覧

Copyright (C) 2025 71歳の爺さんが生成AIを学ぶ  All Rights Reserved
サイト内の記事、写真など、すべてのコンテンツの無断複写・転載等を固く禁じます。