1185【Dev】データ構造化エンジニア(ドキュメント構造化/LLM新規事業)
- 年収
-
700万円〜1,100万円
- 勤務地
-
東京都
- 職務内容
-
【現状の課題】
2024年に立ち上げたLLM新規事業において、エンタープライズ企業が保有する膨大な「Excelドキュメント」の活用が急務となっています。しかし、Excel特有の複雑な仕様(セル結合、多段ヘッダ、視覚的なレイアウトなど)をLLMが解釈可能な形式に高精度に変換・構造化することは技術的難易度が高く、一般的なパーサーでは対応しきれません。
現在、この「Excel構造化」という重要かつ高難易度なテーマに専任で向き合い、仕様の深い理解に基づいたパージングロジックの実装と精度向上を担うエンジニアリソースが不足しています。【業務内容】
LLMを用いた新規事業SaaSのバックエンドエンジニアとして、特にExcelファイルを中心としたドキュメント構造化エンジンの開発・実装をリードいただきます。
ML/データサイエンスの知見を活かしつつ、プロダクトレベルで堅牢なデータ処理パイプラインを構築するポジションです。■具体的な業務内容
Excel(Office Open XML等)の仕様を深く理解し、複雑な表構造を論理的に構造化するパージングロジックの開発
構造化データの精度評価環境の構築と、継続的なロジック改善
Pythonを用いたバックエンドAPIおよびデータ処理パイプラインの実装・運用
MLエンジニアやデータサイエンティストと連携した、RAG向けデータ生成プロセス
【チーム構成】
<PaaS Unit>
事業責任者(CEO)1名
開発責任者 1名
プロダクトエンジニア 7名
RAGエンジニア 5名
機械学習エンジニア 3名
プロダクトマネージャー 1名
リサーチャー 1名
CS 1名
Biz 3名
新規事業企画 5名【開発環境】
[使用言語/フレームワーク]
Python、TypeScript、Vue.js 、Node.js
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS, Azure【ポジションの魅力】
ファイル仕様の深淵に潜る、知的な技術挑戦:単なるライブラリ利用にとどまらず、Office Open XML等の仕様レベルまで掘り下げ「Deepな技術開発」に没頭できます。
「アカデミアでのML経験 × 実務での実装力」が活きる:数理的思考をビジネスレベルの堅牢なコードとして昇華させることができます。
エンタープライズRAGの「ラストワンマイル」を解決する:既存のLLMでは活用しきれないExcelデータに対し、ソリューションを提供し企業のDXを推進できます。
【関連資料】
Stockmark LLM特設LP
https://llm.stockmark.co.jp/
業務AIの実装支援プラットフォーム「 SAT 」
https://sat.stockmark.co.jp/
構造化データから自社ナレッジ活用を促進するAIエージェントの開発支援を開始 RAG実用化サービス「SAT」にエージェントショーケース機能をリリース
https://stockmark.co.jp/news/20250423
専門性の高い“暗黙知”を形式知化する生成AI基盤開発へ 製造業特化のマルチモーダルAI基盤を開発
https://stockmark.co.jp/news/20250715
AI×SaaSのマストハブを作る、前人未到の挑戦。45億円の調達を達成したストックマークのその先。
https://note.com/stockmark/n/n8b54893cf532 - 企業名
-
ストックマーク株式会社
- 本社所在地
-
東京都港区南青山1 丁目12-3LIFORK MINAMI AOYAMA S209
- 雇用形態
-
正社員
- 各種保険
-
健康保険 雇用保険 厚生年金 労災保険
- 休日休暇
-
完全週休2日制(休日は土日祝日),年末年始休暇,産前産後休暇,育児休暇,有給休暇(入社時付与 ※付与日数は入社月による)
- 情報更新日
-
2026/04/09
AIが推定した求人関連情報
-
ファイル仕様の深淵に踏み込む知的挑戦:
Office Open XML等の仕様レベルまで掘り下げ、セル結合・多段ヘッダ・視覚的レイアウトなど複雑なExcel構造を論理的に解析するパージングロジックを自ら設計・実装できます。単なるライブラリ利用にとどまらない「Deep技術開発」に没頭できる環境です。 -
LLM新規事業の最前線でRAGの"ラストワンマイル"を担う:
2024年に立ち上げたLLM新規事業において、既存のLLMでは活用しきれないExcelデータを構造化し、エンタープライズRAGを実用化するという、業界全体でも未解決の高難易度課題にゼロイチで挑めます。 -
45億円調達・累計88億円超のグロース只中に参画:
シリーズDで45億円を調達し累計調達額は88億円を超える成長期のAIスタートアップです。資金的な基盤と事業拡大のモメンタムが揃った局面で、事業の中核技術を担うポジションに就けます。 -
MLエンジニア・データサイエンティストと密に連携できるチーム環境:
PaaS Unit内にRAGエンジニア5名・MLエンジニア3名が在籍し、データサイエンス・研究知見を持つメンバーと日常的にコラボレーションしながら、学術的思考と実装力の双方を活かした開発ができます。 -
自己研鑽を後押しする福利厚生と柔軟な働き方:
個人の研鑽に充てられる費用が毎月支給され、書籍・備品購入も会社負担で対応。フルリモート・フルフレックス制により、ワークライフバランスを自分でコントロールしながらスキルアップが可能です。
以下のいずれかの経験・知見が求められます。
- Pythonを用いたバックエンド開発経験
- Office Open XML等のファイルフォーマット仕様の理解・実装経験
- データ処理パイプライン(ETL・変換処理等)の設計・実装経験
- ML・データサイエンス領域の基礎知識(統計・機械学習等)
- AWSまたはAzureを用いたクラウド環境での開発経験
- Dockerを用いたコンテナ環境での開発経験
-
仕様の深掘りを楽しめる探究心:
Excelの複雑な構造や未定義の挙動に対して「なぜ?」を突き詰め、仕様レベルまで自発的に調査・理解しようとする姿勢が求められます。 -
数理的思考とプロダクトコードの橋渡し能力:
アカデミアや研究で培った数理・ML的思考を、ビジネスで通用する堅牢なコードとして実装・運用まで落とし込める実践力が必要です。 -
自律的な課題設定と推進力:
個人の裁量が大きい環境のため、自ら課題を見つけ、優先順位をつけ、能動的に解決策を設計・実行できる自立心が重視されます。 -
クロスファンクショナルなコミュニケーション能力:
MLエンジニア・データサイエンティスト・プロダクトマネージャーなど多様な職種と連携するため、技術的なトピックを非技術者にも分かりやすく伝える能力が求められます。 -
品質・精度への高い意識:
構造化データの精度がRAGの品質に直結するため、単に動くコードを書くだけでなく、精度評価環境の構築や継続的な改善サイクルを回せる品質へのこだわりが必要です。
-
RAG(検索拡張生成)の実装経験:
LLMを活用したRAGシステムの設計・開発経験があると、データ構造化の出力がどのように活用されるかを理解した上で実装に臨めます。 -
TypeScript・Vue.js・Node.jsの開発経験:
バックエンドだけでなくフロントエンドやAPIレイヤーの理解があると、チーム内でより広い範囲に貢献できます。 -
Terraformを用いたIaC(Infrastructure as Code)の経験:
クラウドインフラの構成管理経験があると、開発環境の自動化や本番環境整備の観点でチームへの貢献度が高まります。 -
自然言語処理(NLP)・LLMの研究・実装経験:
ストックマークは自然言語処理AIを核とする企業のため、NLP・LLM関連の研究や実務経験があると技術議論の深度が増します。 -
エンタープライズ向けSaaS開発経験:
大企業向けプロダクトならではの要件(セキュリティ・スケーラビリティ・品質保証等)への理解があると即戦力として活躍できます。
-
Office Open XML等のファイルフォーマット深層解析スキル:
Excelの複雑な仕様を仕様書レベルで理解し、パージングロジックを自ら設計・実装する経験を通じて、業界でも希少なファイル解析の専門技術が身に付きます。 -
エンタープライズRAG向けデータエンジニアリング力:
構造化データの精度評価環境構築から継続的な改善サイクルの設計まで、実際のビジネス課題に紐づいたデータパイプライン開発の実践力が習得できます。 -
LLM活用プロダクト開発の実践知識:
LLM新規事業のバックエンドとして、LLMが解釈可能な形式へのデータ変換・連携設計など、生成AIプロダクト開発における最前線の実装ノウハウが蓄積されます。 -
MLエンジニア・研究者との協働経験:
ML・データサイエンス領域の専門家と日常的に協働することで、研究と実装の橋渡し能力、および数理的アプローチをプロダクトに落とし込む設計力が磨かれます。 -
AWS・Azureを活用したクラウドネイティブ開発スキル:
Docker・Terraform・クラウド(AWS/Azure)を組み合わせたモダンな開発スタックを日常業務で活用することで、クラウドインフラ全般の実践スキルが向上します。
- 現在
- データ構造化スペシャリスト Excel・ドキュメント構造化エンジンの精度と堅牢性を牽引する技術専門家として、社内外で高い評価を得るポジションです。ファイルフォーマット解析・RAGデータ生成の第一人者として活躍できます。
- テックリード / RAGエンジニアリングリード PaaS Unit内のデータ構造化・RAG基盤全体を技術的にリードし、アーキテクチャ設計から品質基準策定まで担う役割へのステップアップが期待されます。
- MLエンジニア / AI基盤エンジニア データ構造化の経験を土台に、LLM・機械学習モデルの開発・評価まで守備範囲を広げ、AI基盤エンジニアとしてモデル開発にも関与するキャリアパスも視野に入ります。
- 開発責任者 / プロダクトエンジニアリングマネージャー チームのエンジニアリング全体を統括する開発責任者、またはPaaS Unit全体の技術戦略を担うマネジメントポジションへの昇格が考えられます。
- 起業・独立 / 社外エキスパートとしての活躍 LLM×エンタープライズデータ活用という希少領域のスペシャリストとして、スタートアップCTO・独立コンサルタント・テック系アドバイザーなど、市場価値の高い外部キャリアへの展開も可能です。
【ポジティブな評価】
1. 働き方の柔軟性: フルリモート勤務が可能で、フルフレックス制との組み合わせにより、子育て中の社員も含めて勤務時間・場所を自由に選択できるとの評価が多い。シェアオフィスも利用可能で、状況に応じた使い分けができる。
2. 自己研鑽支援: 個人の研鑽に充てられる費用が毎月支給され、書籍や備品の購入も会社負担で対応。スキルアップのための資格受験費用補助も存在し、学習環境として充実しているとの声がある。
3. 裁量の大きさ: 個人の裁量権が大きく、声を上げれ...(ここから先は会員登録後にご覧いただけます。残り479文字)
会員登録をして、
AI 口コミ全貌をチェック!
※本資料はAIを活用して収集・整理した情報を含んでいます。正確性については適宜ご確認ください。