ChatGPTチェッカーツール:AIエッセイ検出ツールの抜け穴を暴く

急速に進歩する人工知能(AI)の分野で、新たな研究が、アカデミック・インテグリティの維持に不可欠なChatGPTチェッカーツールの深刻な弱点を明らかにしました。

具体的にはAIエッセイを検出するために設計されたツールには弱点があります。学生がこの抜け穴を悪用し、AIが作成した文章を微妙に改変することで、ChatGPTチェックツールをだますことができるのではないかという懸念が浮上しています。

この有益な研究はデボラ・ヴェーバー・ウルフ教授が主導しました。この研究では、TurnitinのAIが生成した学術的な剽窃を検出するツールGPT Zero、Compilatioなどような有名なものを含む、広く使われている14のChatGPTチェッカーツールを調査しました。開発者たちは、学生がOpenAIのChatGPTのような高度なAIシステムを小論文作成に悪用するかもしれないという懸念に応えて、これらのツールを作成しました。

ChatGPTチェッカーのジレンマ:AI小論文検出ツールの見えない欠陥を暴く

この調査では、これらのChatGPTチェッカーツールに関する驚くべき事実が明らかになりました。これらの検出ツールの全体的な精度は低く、80%の精度に達したものはありませんでした。

この研究では、人間が書いた文書がAIによって作成されたと誤って認識されるような、かなりの数の偽陽性が確認されました。さらに、ツールは多くのAIが生成したテキストを誤って人間が書いたものと診断しました。

偽陰性は良くありませんが、偽陰性はもっと悪いといえます。無実の生徒が、このようなツールの1つの間違いで罰せられる可能性があるのです。

この調査ではさらに、検知ツールに偏りがあることも明らかになりました。AIが作成したコンテンツを検出するよりも、出力された文章を人間が書いたものと分類する傾向があるのです。平均して、AIが作成した文章の20%は人間が書いたものと間違われる可能性が高いといえます。

興味深いことに、隠蔽技術によって改変されたAI生成テキストをチェックするとなると、ツールの性能は悪化しました。これには、手作業による編集や機械による言い換えが含まれ、誤認識率は約50%に達します。

さらに、他の言語から翻訳されたテキストは、検出ツールにとって苦労の種となりました。

加速するAIの進歩:広がる応用と根強い課題

これらの発見は、AIの絶え間ない進歩がもたらす課題にスポットライトを当てています。これらの開発を理解する上で中心的な役割を果たすのが、トレーニング計算という概念であり、これはしばしばFLOP(浮動小数点演算)の総数で測定されます。訓練計算とは、AIシステムの訓練に使用されるコンピュータ演算の総数を指します。要するに、1FLOPは2つの10進数の足し算、引き算、掛け算、割り算のいずれかに相当し、1ペタFLOPは1クアドリリオン(10^15)FLOPに相当します。

1ペタFLOP未満で動作していた1960年代のADALINEモデルの謙虚な始まりから、AIは大きな進歩を遂げました。この成長は、2023年に発表されたGPT-4モデルによって示されています。GPT-4モデルは、なんと210億ペタFLOPを演算に利用しています。

加速するAIの進歩

ソース:データで見る我々の世界

この計算能力の飛躍は、AIの多様な応用に対応しています。画像処理や言語処理から、ゲーム、音声認識、マルチモーダルデータ処理にまで及びます。AlphaGo Fan、AlphaGo Lee、AlphaGo Zeroなどは、計算の複雑さが急速に増していることを示す役割を果たし、戦略的用途におけるAIの複雑な可能性を強調しています。

GPT-4やM6-Tに代表されるように、マルチモーダルモデルがますます重視されるようになっていることは、AI業界がさまざまなタイプのデータを統合する方向にシフトしていることを浮き彫りにしています。これにより、AIが世界を理解し、対話する能力が高まります。

AIの目覚ましい発展と応用の可能性にもかかわらず、アカデミック・インテグリティの確保といった課題は依然として残っています。Weber-Wulffらの研究は、AIが作成したテキストを検出するための「簡単な解決策」は存在しないかもしれませんし、おそらく存在し得ないかもしれないことを強く示唆しています。その結果、検出戦略から予防策へと焦点を移す必要があり、教育者は継続的に学力評価技術を見直す必要があります。文章による評価は、最終的な成果物よりもむしろ、学生のスキルの発展過程に重点を置くべきなのでしょう。

今買うべき最高の暗号は?

私たちの評価

  • B2Cが2023年の暗号通貨ランキングを発表
  • プレセールとプライベートセールへの早期アクセス
  • KYC 検証済み & 監査済み、公開チーム
  • CoinSniperで最も投票されたトークン
  • 取引所への上場予定、NFTドロップス