トップページ>ブログ>ポスト

人間とAI、どちらが書いたコードか判別せよ！

アドベントカレンダー2025 機械学習

2025-12-04

はじめに

jackアドベントカレンダー2025ついに始まりました！

4日目担当のめろです。

今回は2025年8月1日~8月31日に開催されたTrackが主催するAIコンペに参加し、学生5位を取ることができたので、その話をしようと思います。【人間とAI、どちらが書いたコードか判別せよ！】

1. コンペの概要

コンペティション内容
日程
データ
賞金（社会人 / 学生）それぞれ総額50万円

2. 自分の解法

解法の方針

Transformerベースのモデルをファインチューニングして、コードから「LLM特有の癖」や「人間特有の書き方」を機械的に抽出して分類する方針をとりました。

💡

Transformerとは？文章全体を一度に見渡して、言葉の裏にある意味や文脈を深く理解することができるモデルです。 ChatGPTの最後の「T」はTransformerを指しています。

💡

ファインチューニングとは？「学習済みモデル」に、特定のデータを追加で学習させて微調整する手法です。これにより、特定の専門分野や業務タスクに特化した、精度の高いモデルを作ることができます。

解法の内容

Trainデータが少なかったので、外部データを使ってデータ数を増やしました。

その後、microsoft/codebert-base、microsoft/unixcoder-base、Salesforce/codet5p-220mなどのHugging Faceにあるプログラミングコードで事前学習されたモデルを7つ使い、予測結果のアンサンブルをしました。

💡

アンサンブルとは？モデルの予測結果を組み合わせて、単一のモデルよりも精度を高めることです。今回は多数決（人間と判断したモデルの数と、AIと判断したモデルの数のうち多いほうを最終的な出力として決める）にしました。

3. 結果（Testデータに対するF1スコア）

	社会人	学生
1位	0.99689	0.99029
2位	0.98714	0.98194
3位	0.96913	0.98187
4位	0.96656	0.97909
5位	0.95453	0.97434（自分）

学生5位をとることはできましたが、入賞圏内である3位にはあと一歩届きませんでした。

4. 上位解法

社会人1位の方の解法

Step1

ChatGPT4.1とQwen3-Coder-30B-A3B-Instruct(QLoRA)をファインチューニングする。その後、Testデータに対して予測をしてアンサンブル（単純平均）する。

Step2

Step1で出した予測結果のうちの予測確率が上位のものをTrainデータに追加する（疑似ラベリング）をして、Codellama-13b-Instruct-hfやQwen2.5-Coder-7B-Instructなどの4つのモデルをファインチューニングする。その後、Testデータに対して予測をしてアンサンブル（単純平均）する。