· FinDocGen  · 10 min read

新プロジェクト始動:AIで財務分析を自動化する『FinDocGen』の開発

データ×AIで投資家の意思決定支援を目指す新プロジェクト『FinDocGen』を開始。今後の展望を紹介します。

有価証券報告書を開いて30分。気づけば溜息をついていました。

「銘柄のチェックって何でこんなに時間がかかるんだろう…」

100ページを超える文書を読み込み、財務三表を比較し、セグメント情報を追いかけ、そしてようやく「懸念点」が見えてくる。株式投資、特にバリュー投資を続けてきた私にとって、この「情報の海での溺れかけ」は日常茶飯事でした。

しかし、2025年。生成AI技術が飛躍的に進化したこの年、私はある確信を持ちました。

「システムエンジニアの技術で、この苦しみを解決できるんじゃないか?」

今年2026年、私は『データ×AI』で投資分析を根本から変えるプロジェクトに挑戦します。それが、『FinDocGen(Financial Document Generator)』 です。


投資家が直面する「情報過多」という真の課題

結論から言います。バリュー投資の成否を分けるのは「情報量」ではなく「情報の質と処理速度」です。

私がこのプロジェクトを始めたきっかけは、ある失敗体験にあります。2024年秋、注目していた中小型株の決算発表がありました。EDINETで有報が公開され、私はいつものように精読を開始。しかし、セグメント別の収益構造を分析している間に2日が経過し、気づけば株価は既に20%上昇していました。

「情報はあった。でも、処理が遅すぎた」

この悔しさが、エンジニアとしての私を突き動かしました。

一次情報へのアクセスは平等、でも処理能力は不平等

バリュー投資において最も価値があるのは「一次情報」、つまり有価証券報告書や決算短信です。これらはEDINETやTDnetで誰でもアクセスできます。

しかし、現実はこうです:

  • 有価証券報告書: 平均120ページ、複雑な表形式データが満載
  • 決算短信: タイムリーだが定性情報が薄い
  • 適時開示: 毎日数百件が更新される

つまり、「読む」のではなく「処理する」能力が求められているのです。

そこで私は考えました。「この銘柄の懸念点はどこか?」「中期経営計画の進捗は?」「今の株価は指標的に割安か?」——これらの問いに、EDINET・TDnetのデータから自動で答えを引き出し、構造化されたレポートとして出力する仕組みがあれば、と。


FinDocGen とは何か:定義と3つのコア機能

FinDocGenとは、Pythonで財務データ・公的開示書類を取得・解析し、生成AIを活用して投資家向けインサイトを自動出力するツールです。

なぜこのツールが必要なのか?

従来の財務分析ツールは「データの可視化」に留まります。しかし、投資判断に本当に必要なのは「解釈」です。FinDocGenは、以下の3つのステップで「データから洞察へ」の橋渡しを行います。

ステップ従来の手法FinDocGenのアプローチ
1. 情報収集手動でEDINET/TDnetを検索Auto Collectorで自動取得
2. 分析ExcelやNotebookで手作業AI Analyzerで定性情報を要約・抽出
3. 記録・共有個人メモや非構造化ドキュメントAuto GenerationでMarkdown/MDX形式で出力

🚀 コア機能の詳細

1. Auto Collector(自動収集エンジン)

EDINETやTDnetのAPIを活用し、指定した銘柄の最新情報を定期的に取得します。

私がこの機能に込めたこだわりは「取りこぼしゼロ」です。適時開示は朝9時から夜まで不定期に更新されます。これを人間が監視し続けるのは不可能ですが、Pythonのスケジューラなら容易です。

2. AI Analyzer(AI駆動の分析エンジン)

生成AIを活用し、有価証券報告書の「事業等のリスク」や「経営方針」といった定性情報を要約。さらに、過去の開示内容と比較して「変化点」を自動検出します。

なぜ定性情報に注目するのか?その理由はシンプルです。財務三表の数字は「結果」ですが、定性情報には「経営者の意図」が滲み出ているからです。

3. Auto Generation(構造化出力)

出力形式には Markdown/MDX を採用しました。これにより、この「86note」サイトで即座に記事として公開でき、かつコンポーネント化も可能です。

たとえば、以下のような出力が自動生成されます:

## [企業名] 2025年度 第3四半期 分析レポート

### 🎯 注目ポイント
- 営業利益率が前年同期比+2.5%改善
- 海外売上高比率が初めて30%を突破

### ⚠️ リスク要因
- 為替変動リスクが増大(経営者コメントより)

このプロジェクトで目指すもの

FinDocGenの最終ゴールは「投資判断の民主化」です。

機関投資家には専任のアナリストチームがいます。彼らはBloombergやリフィニティブといった高額ツールを使い、リアルタイムで企業情報を処理します。

しかし、個人投資家はどうでしょうか?私たちには時間も予算も限られています。

だからこそ、オープンソースの技術とAIを組み合わせ、個人でも機関投資家レベルの情報処理能力を手にする。それが、このプロジェクトの本質的な意義です。

開発過程もすべて公開します

さらに驚くべきことに——このプロジェクトの開発過程、技術選定の理由、そして実際の分析結果まで、すべてこの 86note で発信していきます。

なぜオープンにするのか?それは、私自身が多くのエンジニアやデータサイエンティストのブログから学んできたからです。知識は共有されることで価値を増します。


今後の展開:ロードマップ

2026年1月時点での開発ロードマップは以下の通りです。

Phase 1: データ収集基盤の構築(1月)

  • EDINET API連携の実装
  • TDnet情報の自動取得機能
  • データベース設計とストレージ最適化

Phase 2: AI分析エンジンの開発(2月)

  • LLMを活用した定性情報の要約機能
  • 過去データとの差分検出アルゴリズム
  • リスク要因の自動抽出

Phase 3: 出力フォーマットの整備(3月)

  • Markdown/MDX形式での自動生成
  • 86noteサイトへの自動投稿機能
  • ダッシュボードUI(検討中)

Phase 4: 実運用とフィードバック(4月〜)

  • 実際の投資判断での活用
  • 精度改善とチューニング

おわりに:情報の「量」ではなく「質」の戦いへ

投資は「情報戦」です。しかし、それは「誰が多くの情報を持っているか」の戦いではありません。

「誰が情報を素早く整理し、的確に解釈できるか」の戦いです。

私がFinDocGenに込めた想いは、単なる「便利ツール」を超えています。これは、個人投資家がテクノロジーを武器にして、フェアな競争環境を手に入れるための挑戦です。

開発の過程で得られた知見、失敗談、そして分析結果は、引き続きこの 86note で発信していきます。AI×投資、あるいは自動化・データエンジニアリングに興味がある方の参考になれば、これほど嬉しいことはありません。

2026年、一緒にデータとAIの可能性を探求していきましょう。

今年もどうぞよろしくお願いいたします!🚀

Share:
Back to Blog

DABSプロジェクトのディレクトリ構成例

DABS (Data and Analytics for Business Solutions) プロジェクトの典型的なディレクトリ構成例を紹介します。共通ライブラリと実行アプリケーションを分離し、メンテナンス性と再利用性を高める方法を解説します。