1185【Dev】データ構造化エンジニア(ドキュメント構造化/LLM新規事業)
- 年収
-
700万円〜1,100万円
- 勤務地
-
東京都
- 職務内容
-
【現状の課題】
2024年に立ち上げたLLM新規事業において、エンタープライズ企業が保有する膨大な「Excelドキュメント」の活用が急務となっています。しかし、Excel特有の複雑な仕様(セル結合、多段ヘッダ、視覚的なレイアウトなど)をLLMが解釈可能な形式に高精度に変換・構造化することは技術的難易度が高く、一般的なパーサーでは対応しきれません。
現在、この「Excel構造化」という重要かつ高難易度なテーマに専任で向き合い、仕様の深い理解に基づいたパージングロジックの実装と精度向上を担うエンジニアリソースが不足しています。【業務内容】
LLMを用いた新規事業SaaSのバックエンドエンジニアとして、特にExcelファイルを中心としたドキュメント構造化エンジンの開発・実装をリードいただきます。
ML/データサイエンスの知見を活かしつつ、プロダクトレベルで堅牢なデータ処理パイプラインを構築するポジションです。■具体的な業務内容
Excel(Office Open XML等)の仕様を深く理解し、複雑な表構造を論理的に構造化するパージングロジックの開発
構造化データの精度評価環境の構築と、継続的なロジック改善
Pythonを用いたバックエンドAPIおよびデータ処理パイプラインの実装・運用
MLエンジニアやデータサイエンティストと連携した、RAG向けデータ生成プロセス
【チーム構成】
<PaaS Unit>
事業責任者(CEO)1名
開発責任者 1名
プロダクトエンジニア 7名
RAGエンジニア 5名
機械学習エンジニア 3名
プロダクトマネージャー 1名
リサーチャー 1名
CS 1名
Biz 3名
新規事業企画 5名【開発環境】
[使用言語/フレームワーク]
Python、TypeScript、Vue.js 、Node.js
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS, Azure【ポジションの魅力】
ファイル仕様の深淵に潜る、知的な技術挑戦:単なるライブラリ利用にとどまらず、Office Open XML等の仕様レベルまで掘り下げ「Deepな技術開発」に没頭できます。
「アカデミアでのML経験 × 実務での実装力」が活きる:数理的思考をビジネスレベルの堅牢なコードとして昇華させることができます。
エンタープライズRAGの「ラストワンマイル」を解決する:既存のLLMでは活用しきれないExcelデータに対し、ソリューションを提供し企業のDXを推進できます。
【関連資料】
Stockmark LLM特設LP
https://llm.stockmark.co.jp/
業務AIの実装支援プラットフォーム「 SAT 」
https://sat.stockmark.co.jp/
構造化データから自社ナレッジ活用を促進するAIエージェントの開発支援を開始 RAG実用化サービス「SAT」にエージェントショーケース機能をリリース
https://stockmark.co.jp/news/20250423
専門性の高い“暗黙知”を形式知化する生成AI基盤開発へ 製造業特化のマルチモーダルAI基盤を開発
https://stockmark.co.jp/news/20250715
AI×SaaSのマストハブを作る、前人未到の挑戦。45億円の調達を達成したストックマークのその先。
https://note.com/stockmark/n/n8b54893cf532 - 企業名
-
ストックマーク株式会社
- 本社所在地
-
東京都港区南青山1 丁目12-3LIFORK MINAMI AOYAMA S209
- 雇用形態
-
正社員
- 各種保険
-
健康保険 雇用保険 厚生年金 労災保険
- 休日休暇
-
完全週休2日制(休日は土日祝日),年末年始休暇,産前産後休暇,育児休暇,有給休暇(入社時付与 ※付与日数は入社月による)
- 情報更新日
-
2026/03/08