TurnitinはAIレポート生成に使うAI検出器は何?

あなたは最新のエッセイの「submit」をクリックしたばかりですが、裏ではTurnitinがすでに全力で作業を進めています.
近年、ChatGPTのような技術がますます高度化する中で、TurnitinがどのAI検出器を用いてあなたの提出物をチェックしているのか、一度は疑問に思ったことはありませんか? この記事では、TurnitinのAI検出器について詳しく解説します。
しかし、もしもすぐにAI解析が必要なら、T-detectorがTurnitin自身の報告内容を反映し、重要な洞察を迅速に提供してくれます.
それでは、TurnitinのAI技術の背後にあるテクノロジーを探ってみましょう!
What AI Detector Does Turnitin Use?
概要
Turnitin はその AI 検出能力を AI Writing Indicator と呼んでいます。この技術は主に Huggingface によって開発されたオープンソースの基本モデルを基盤としており、広範な再学習、評価、そして微調整を重ねています。
Turnitin の AI 検出器の優位性は、先進技術と 20 年以上にわたる実際の学生文章の分析経験を融合している点にあります。この豊富な経験により、AI Writing Indicator は誤検出を極力抑え、特に最新世代の Large Language Models (LLMs) に対して高い検出精度を発揮するよう緻密に調整されています。
AI Writing Indicator は、主に以下の 2 種類のコンテンツを検出するよう設計されています:
AI-Generated Text: 人間の介入を介さずに AI が直接生成したテキスト。
AI Paraphrasing: 本来 AI によって生成されたテキストを、AI の起源を隠すために改変(パラフレーズ)したもの。しばしば盗用検出を回避する目的で使用されます。
トレーニング、継続的な更新、および将来への対応
Turnitin の AI モデルは、世界各地の多様な教科や、第二言語学習者、非英語圏の学生など、十分に代表されていないグループの文章を含む幅広いデータセットで訓練されています。この包括的なアプローチにより、AI 検出時のバイアスを減少させ、さまざまな学術的状況において AI 生成コンテンツを的確に識別する能力が向上しています。
AI 技術の進化に伴い、Turnitin の検出能力も進化しています。当初は GPT-3 および GPT-3.5 のコンテンツ検出に特化していた Turnitin ですが、現在は GPT-4、GPT-4o、Gemini (Pro)、さらには LLaMA といった新たなモデルの検出も実施中です。GPT-4 に対するテストでも良好な結果が得られており、Turnitin は新モデルの登場に合わせて検出能力のさらなる向上を継続していく予定です。
Turnitin AI Detectorの仕組み
概要
TurnitinのAI Writing Indicatorは、AIが生成またはパラフレーズしたテキストを効率的に検出するために設計されています。提出された文書は、以下の段階的な方法で処理されます:
提出された文書はまず、約5~10文ごとに分割され、管理しやすいセグメントにされます。この分割により、テキスト解析をより小さな、正確な部分で行うことが可能になります。
各セグメントは少しずつ重なり合い、各文がより広い文脈の中で解析されるようになっています。この重なりは、解析時にテキストの自然な流れを保つために重要です。
その後、各文には0から1のスコアが付けられ、0は人間が書いたこと、1はAIが生成したことを示します。このスコアリングにより、人間の文章とAI生成の文章を区別することができます。
すべてのセグメントのスコアの平均が、文書全体におけるAI生成部分の割合を示す予測として算出されます。
AIパラフレーズ検出
さらに、Turnitinは、文章が直接AIによって生成されたものではなく、AI生成のパラフレーズ処理を経ている場合にも対応し、学生が単にパラフレーズするだけでシステムを回避できないようにしています。
第一段階での検出: 最初に、AI生成の兆候がAIパラフレーズ予測モデルに入力され、更なる解析が行われます。
もしAI生成のセグメントが検出された場合、その部分は追加のAIパラフレーズモデルを用いて解析されます。
このAIパラフレーズモデルは、AI生成テキストが編集されたのか、単にパラフレーズされたのかを区別します。
パラフレーズされていないテキストは高いAIスコアを保持し、パラフレーズされたテキストは低いスコアとなります。
識別報告: AI文書レポートでは、テキストがAI生成されたものと、パラフレーズされたものを視覚的に確認できるようになっており、各タイプに異なる色が割り当てられています。
AIライティング検出のためのパラメーター
AI生成コンテンツを検出する際には、TurnitinはGPT-3やChatGPTなどのAIモデルがどのように単語を選択しているかに注目しています。これらのAIツールは、膨大なインターネットデータに基づいて、前の単語に続く最も可能性の高い単語を予測しながらテキストを生成するため、文章は滑らかで予測しやすい流れとなります。一方で、人間が書く文章はより多様で予測が難しい傾向にあります。
例: 例えば、AIツールが「今日の天気は非常に快晴で晴天です」と書いた場合、前の単語に続く確率の高い単語が順次選ばれます。これに対し、人間は「わあ、なんて晴れた日なんだ!」といった表現をするため、単語の選び方に予測不可能な部分が見られます。
Turnitinの分類器は、このような単語の並び方のパターンを精密に捉えるよう調整されており、定型的なAI生成テキストと、多様で個性的な人間の文章を効果的に見分けることができます。
クラスIDなしでTurnitin AIレポートを取得する方法
生徒は検出レポートを見ることができるのか?
いいえ、検出レポートにアクセスするのは簡単ではなく、すべてはあなたの学校や教師の判断に依存します。
公式情報によると、Turnitin AIレポートはTurnitin Originalityのライセンスを持つクライアントにのみ提供されています。
あなたの学校の設定次第で、課題に対するAI検出機能が有効になるかどうかが決まります。学校のシステム内では、AIレポートの結果は類似性レポートに統合されていますが、特定のアクセス権を持つ者にのみ表示されます。つまり、教師も生徒も、適切な資格情報がなければTurnitin AIレポートにアクセスすることはできません。
AIレポートの取得方法
何か回避策をお探しですか? ならば、T-detectorをご利用ください。このツールは、Turnitin自体のAI検出器に極めて近いレベルで、教師が見るのと同じAIスコアを含むレポートを提供します。プロセスはとても簡単で、ドキュメントをアップロードして約5-20 分待つだけです。Turnitinが生成するレポートに類似した結果が得られます。
FAQ
AIの割合は時間とともに変わるのでしょうか?
はい、Turnitinのモデルが進化するにつれて、検出能力が変わるため、AIの割合にも影響が出る可能性があります。ただし、文書自体は再提出されない限り、AIの割合は固定されています。
TurnitinはGrammarlyの基本的なチェックをAIとみなしますか?
いいえ、TurnitinはGrammarlyによる基本的なスペルチェック、文法チェック、句読点の修正をAIとしては扱いません。しかし、ドラフト作成やパラフレーズなど、GrammarlyのAI機能によって修正されたテキストは、AI生成と判断される場合があります。
TurnitinはGPT-4によるテキストを検出可能ですか?
はい、Turnitinは最新のAIモデルを認識するために常にアップデートされており、GPT-4が生成したテキストを検出できます。
TurnitinはAIによるパラフレーズも検出できますか?
はい、TurnitinはAIがパラフレーズした内容を、通常のAI検出機能と組み合わせて検出します。
TurnitinのAI検出ツールはどの言語に対応していますか?
現時点では、TurnitinのAI検出は主に英語に対応しており、今後はさらに多くの言語に拡大する予定です。
TurnitinのAIライティング指標の精度はどの程度ですか?
Turnitinは、AIコンテンツが20%以上含まれる文書について、誤検出率を1%未満に抑えると約束しています。ただし、誤検出を減らすために、AIが生成したテキストの最大15%を見逃す可能性もあります。
Turnitinの「良い」スコアとはどのようなものですか?
一般的に「良い」Turnitinスコアとは低い値を指し、AIの関与がほとんどないことを示します。具体的な基準は、使用する機関や課題の種類によって異なります。
Conclusion
これでTurnitinのAI検出ツールがエッセイをどのように評価するか、その仕組みの解説を終わります!最先端の技術と継続的なアップデートにより、TurnitinはGPT-3、GPT-4などのモデルで生成されたテキストを的確に見つけ出すことができます。通常、AIレポートは教員専用ですが、T-detectorのようなツールを利用すれば、学生でも同様のインサイトを得ることが可能です。これにより学術的な誠実さが保たれ、提出物に安心感がもたらされます。ご参考になれば幸いです—最後までお読みいただき、ありがとうございました!