ATSガイド · 2026-06-13
ATSは履歴書をどう読むか:解析の仕組み解説(2026年)
手っ取り早い答え
ATSは人間のように履歴書を読むわけではありません。ファイルをパーサー(解析エンジン)に通し、氏名、連絡先、職種、日付、スキルといった構造化データを抽出して、データベースの各フィールドに振り分けます。採用担当者はその後、これらのフィールドをキーワードで検索・絞り込みします。表・段組み・ヘッダー・画像内のテキストなど、パーサーが読み違えたものは、検索可能なレコードには一切反映されません。だからこそ、実際のテキストを使ったシンプルな一段組みのフォーマットが何よりも重要なのです。
応募者追跡システム(ATS)は、採用担当者のようにあなたの履歴書を「読む」わけではありません。ファイルをパーサーに通します。これは、非構造化された文書から構造化データを抽出するために設計されたソフトウェアです。このパイプラインの各ステップで何が起きているかを理解することが、俗説を追いかけるのではなく、履歴書の本当の問題を解決するための最も確実な近道です。
ステップ1:アップロードとファイル変換
応募ポータルから履歴書を送信すると、システムはファイルを受け取り、変換を開始します。PDFの場合はテキストレイヤーを抽出します(スキャンした画像PDFの場合はOCRを試みます)。.docxファイルの場合は、その下にあるXML構造を読み取ります。
この段階での重要なポイント:もしPDFが紙の書類をスキャンして作成されたものだったり、文字ではなくパス(図形)としてテキストを埋め込むデザインツールから保存されたものだったりすると、抽出されるテキストは空だったり文字化けしたりする可能性があります。履歴書は必ずワープロソフトか、テキストベースのPDFエクスポートから作成してください。写真やデザインファイルから作ってはいけません。
ステップ2:セクションの検出
パーサーはセクションの見出し(「職務経歴」「学歴」「スキル」「資格」といった言葉)を探し、それを使って履歴書をラベル付けされた領域に分割します。「学歴」の見出しに続く内容は学歴データとしてタグ付けされ、「スキル」の下の内容はスキルとしてタグ付けされます。
これが、標準的でない見出しが問題を引き起こす理由です。「私が成長した場所」や「私の武器庫」といった見出しは認識されない可能性があり、その下の内容は誤ったカテゴリーに振り分けられるか、あるいは完全に破棄されてしまいます。
ステップ3:フィールドの抽出
各セクション内で、パーサーは特定のフィールドを抽出します。職務経歴セクションでは、職種、雇用主名、勤務地、開始日、終了日、そして業務内容の箇条書きの特定を試みます。学歴セクションでは、学位の種類、専攻分野、教育機関、卒業年月を抽出します。
複数段組みのレイアウトは、このステップで抽出失敗を引き起こす一般的な原因です。2つの段組みのテキストがあると、多くのパーサーは全幅にわたって行ごとに左から右へ読み取り、無関係なセクションの内容を混ぜ合わせてしまいます。左の段の職種が右の段のスキルと連結されてしまい、両方とも使い物にならなくなることがあります。
フィールド抽出を壊しやすいもの
- 表とテキストボックス:これらの要素内の内容は、しばしばスキップされたり、順序が入れ替わって抽出されたりします。
- ヘッダーとフッター:文書のヘッダーやフッターに置かれた連絡先情報は、読み取られないことがよくあります。氏名、電話番号、メールアドレスは本文中に記載してください。
- 標準的でない日付形式:「2021年春」や「2020年第3四半期」のように書かれた日付は解析されない可能性があります。「2021年5月」や「2021年」を使ってください。
- 連絡先情報のアイコンや記号:電話番号の前の電話アイコンや、URLの前のLinkedInアイコンは、それらのフィールドの抽出を壊す可能性があります。
- レイアウトとして使われた表の結合セル:よく使われるデザインの小技ですが、確実に解析エラーを引き起こします。
- テキストに重なるグラフィック要素:テキストの上に配置された視覚的なスキルバー、評価チャート、装飾的な区切り線は、その下にあるテキストの読み取り漏れを引き起こします。
ステップ4:採用担当者によるキーワード検索と絞り込み
あなたのレコードがデータベースに入ると、採用担当者が何を検索するかによって、表示されたり(されなかったり)します。ソフトウェアエンジニア職を担当する採用担当者は「Python」や「AWS」や「シニアエンジニア」で検索するかもしれません。そして、解析されたレコードにこれらの用語が含まれる候補者だけが検索結果に表示されます。
ここから導かれる実践的な意味:完璧にフォーマットされた履歴書であっても、採用担当者が検索する用語とは異なる表現を使っていれば、検索結果には表示されません。「アジャイルプロジェクトマネジメント」と「スクラムマスター」は意味の面で大きく重なりますが、キーワード検索では重ならないかもしれません。求人票が使っている言葉をそのまま反映させることが、最も確実な対策です。
ステップ5:任意のランキング
多くのシステムは、求人票と解析された履歴書フィールドとのキーワードの重なりに基づいて、ランクやマッチスコアを提供します。このスコアは、自動的な足切りではなく、並び替えの道具として採用担当者に表示されます。採用担当者はスコアで並び替えることも、無視することも、独自の重み付けを設定することもできます。「合格」か「不合格」かを決める普遍的に公表された基準値は存在しません。その判断は常に人間が下します。
よくある質問
ATSはPDF履歴書を読めますか?
はい、PDFに本物のテキストレイヤーが含まれている限り読めます。Microsoft Word、Google ドキュメント、あるいは標準的なワープロソフトから保存すれば、テキストレイヤーは含まれます。リスクはファイル形式そのものではなく、パーサーをつまずかせるレイアウトの複雑さ(段組み、テキストボックス、表)にあります。きれいな一段組みのPDFは、現代のシステムの大多数で問題なく解析されます。
ATSは私のカバーレターを読みますか?
多くのシステムはカバーレターを別途受け付けてテキストフィールドとして保存しますが、採用担当者がどれだけ重視するかは大きく異なります。キーワードマッチングとフィールド抽出にとって、主に解析される文書は履歴書です。最適化の労力はそこに集中させましょう。
パーサーが失敗すると、私の履歴書はどうなりますか?
解析が失敗または部分的に失敗すると、通常あなたのレコードは空欄または誤ったフィールドのままシステムに登録されます。技術的には「データベースに登録されている」状態かもしれませんが、あなたのスキル、職種、経験レベルで検索してもあなたは表示されません。実践的な観点では、解析の失敗は応募していないのと同じ効果をもたらします。
履歴書が正しく解析されたかどうか、どうすればわかりますか?
唯一の確実な方法は、テストすることです。ATSGrader のようなツールは解析ステップをシミュレートし、履歴書の内容がどのように抽出されているかを表示します。すべてブラウザ内で完結し、何も保存もアップロードもされません。
関連記事:ATSとは何か、どのように機能するのか · ATS対応の履歴書フォーマット · なぜ履歴書はATSに落とされるのか