· FinDocGen · 10 min read
新プロジェクト始動:AIで財務分析を自動化する『FinDocGen』の開発
データ×AIで投資家の意思決定支援を目指す新プロジェクト『FinDocGen』を開始。今後の展望を紹介します。
有価証券報告書を開いて30分。気づけば溜息をついていました。
「銘柄のチェックって何でこんなに時間がかかるんだろう…」
100ページを超える文書を読み込み、財務三表を比較し、セグメント情報を追いかけ、そしてようやく「懸念点」が見えてくる。株式投資、特にバリュー投資を続けてきた私にとって、この「情報の海での溺れかけ」は日常茶飯事でした。
しかし、2025年。生成AI技術が飛躍的に進化したこの年、私はある確信を持ちました。
「システムエンジニアの技術で、この苦しみを解決できるんじゃないか?」
今年2026年、私は『データ×AI』で投資分析を根本から変えるプロジェクトに挑戦します。それが、『FinDocGen(Financial Document Generator)』 です。
投資家が直面する「情報過多」という真の課題
結論から言います。バリュー投資の成否を分けるのは「情報量」ではなく「情報の質と処理速度」です。
私がこのプロジェクトを始めたきっかけは、ある失敗体験にあります。2024年秋、注目していた中小型株の決算発表がありました。EDINETで有報が公開され、私はいつものように精読を開始。しかし、セグメント別の収益構造を分析している間に2日が経過し、気づけば株価は既に20%上昇していました。
「情報はあった。でも、処理が遅すぎた」
この悔しさが、エンジニアとしての私を突き動かしました。
一次情報へのアクセスは平等、でも処理能力は不平等
バリュー投資において最も価値があるのは「一次情報」、つまり有価証券報告書や決算短信です。これらはEDINETやTDnetで誰でもアクセスできます。
しかし、現実はこうです:
- 有価証券報告書: 平均120ページ、複雑な表形式データが満載
- 決算短信: タイムリーだが定性情報が薄い
- 適時開示: 毎日数百件が更新される
つまり、「読む」のではなく「処理する」能力が求められているのです。
そこで私は考えました。「この銘柄の懸念点はどこか?」「中期経営計画の進捗は?」「今の株価は指標的に割安か?」——これらの問いに、EDINET・TDnetのデータから自動で答えを引き出し、構造化されたレポートとして出力する仕組みがあれば、と。
FinDocGen とは何か:定義と3つのコア機能
FinDocGenとは、Pythonで財務データ・公的開示書類を取得・解析し、生成AIを活用して投資家向けインサイトを自動出力するツールです。
なぜこのツールが必要なのか?
従来の財務分析ツールは「データの可視化」に留まります。しかし、投資判断に本当に必要なのは「解釈」です。FinDocGenは、以下の3つのステップで「データから洞察へ」の橋渡しを行います。
| ステップ | 従来の手法 | FinDocGenのアプローチ |
|---|---|---|
| 1. 情報収集 | 手動でEDINET/TDnetを検索 | Auto Collectorで自動取得 |
| 2. 分析 | ExcelやNotebookで手作業 | AI Analyzerで定性情報を要約・抽出 |
| 3. 記録・共有 | 個人メモや非構造化ドキュメント | Auto GenerationでMarkdown/MDX形式で出力 |
🚀 コア機能の詳細
1. Auto Collector(自動収集エンジン)
EDINETやTDnetのAPIを活用し、指定した銘柄の最新情報を定期的に取得します。
私がこの機能に込めたこだわりは「取りこぼしゼロ」です。適時開示は朝9時から夜まで不定期に更新されます。これを人間が監視し続けるのは不可能ですが、Pythonのスケジューラなら容易です。
2. AI Analyzer(AI駆動の分析エンジン)
生成AIを活用し、有価証券報告書の「事業等のリスク」や「経営方針」といった定性情報を要約。さらに、過去の開示内容と比較して「変化点」を自動検出します。
なぜ定性情報に注目するのか?その理由はシンプルです。財務三表の数字は「結果」ですが、定性情報には「経営者の意図」が滲み出ているからです。
3. Auto Generation(構造化出力)
出力形式には Markdown/MDX を採用しました。これにより、この「86note」サイトで即座に記事として公開でき、かつコンポーネント化も可能です。
たとえば、以下のような出力が自動生成されます:
## [企業名] 2025年度 第3四半期 分析レポート
### 🎯 注目ポイント
- 営業利益率が前年同期比+2.5%改善
- 海外売上高比率が初めて30%を突破
### ⚠️ リスク要因
- 為替変動リスクが増大(経営者コメントより)このプロジェクトで目指すもの
FinDocGenの最終ゴールは「投資判断の民主化」です。
機関投資家には専任のアナリストチームがいます。彼らはBloombergやリフィニティブといった高額ツールを使い、リアルタイムで企業情報を処理します。
しかし、個人投資家はどうでしょうか?私たちには時間も予算も限られています。
だからこそ、オープンソースの技術とAIを組み合わせ、個人でも機関投資家レベルの情報処理能力を手にする。それが、このプロジェクトの本質的な意義です。
開発過程もすべて公開します
さらに驚くべきことに——このプロジェクトの開発過程、技術選定の理由、そして実際の分析結果まで、すべてこの 86note で発信していきます。
なぜオープンにするのか?それは、私自身が多くのエンジニアやデータサイエンティストのブログから学んできたからです。知識は共有されることで価値を増します。
今後の展開:ロードマップ
2026年1月時点での開発ロードマップは以下の通りです。
Phase 1: データ収集基盤の構築(1月)
- EDINET API連携の実装
- TDnet情報の自動取得機能
- データベース設計とストレージ最適化
Phase 2: AI分析エンジンの開発(2月)
- LLMを活用した定性情報の要約機能
- 過去データとの差分検出アルゴリズム
- リスク要因の自動抽出
Phase 3: 出力フォーマットの整備(3月)
- Markdown/MDX形式での自動生成
- 86noteサイトへの自動投稿機能
- ダッシュボードUI(検討中)
Phase 4: 実運用とフィードバック(4月〜)
- 実際の投資判断での活用
- 精度改善とチューニング
おわりに:情報の「量」ではなく「質」の戦いへ
投資は「情報戦」です。しかし、それは「誰が多くの情報を持っているか」の戦いではありません。
「誰が情報を素早く整理し、的確に解釈できるか」の戦いです。
私がFinDocGenに込めた想いは、単なる「便利ツール」を超えています。これは、個人投資家がテクノロジーを武器にして、フェアな競争環境を手に入れるための挑戦です。
開発の過程で得られた知見、失敗談、そして分析結果は、引き続きこの 86note で発信していきます。AI×投資、あるいは自動化・データエンジニアリングに興味がある方の参考になれば、これほど嬉しいことはありません。
2026年、一緒にデータとAIの可能性を探求していきましょう。
今年もどうぞよろしくお願いいたします!🚀