1152【Dev】Software Engineer(Data Platform)
- 年収
-
650万円〜1,100万円
- 勤務地
-
東京都
- 職務内容
-
【業務内容】
当社は、ニュース・特許・論文・Web情報など、企業活動に関わる膨大な公開情報を収集・構造化し、最先端の生成AI技術を活用して、企業の意思決定や事業変革を支援する複数のプロダクトを提供しています。
本ポジションでは、これら全プロダクト共通の基盤となるデータ配信システムに位置づけられる、Webクローラーおよび文書配信パイプラインの設計・開発・運用を担っていただきます。プロダクト価値の根幹を支えるデータ基盤として、安定性・スケーラビリティ・拡張性を意識した開発が求められるポジションです。
エンジニアとして記載の課題解決のための開発を進めながら、データプラットフォームチームをリードし生産性の最大化を行うことも期待しています。■具体的な業務内容
・TypeScript/Pythonを用いたWebニュース・特許・論文などを配信するデータプラットフォームの開発と運用
・サーバーレス環境による分散処理のスケーラビリティ向上と監視設計【現状の課題】
・数億件規模のWeb上の文献をクローリング/コンテンツ抽出/配信するためのデータパイプラインを開発、運用する人材が不足している
・自社プロダクトのAI Agent開発のためのデータ拡充の方針検討、要件定義、実装をプロダクトチームのPMやエンジニアとコミュニケーションしつつ自ら実行する人材が不足している【チーム構成】
事業責任者(CEO)1名
開発責任者 1名
プロダクトエンジニア 7名
AI Agentエンジニア 6名
構造化エンジニア 3名
データエンジニア 3名
プロダクトマネージャー 1名
リサーチャー 1名
CS 2名
Biz 8名【開発環境】
[開発言語]
データパイプライン: Python
Webクローラー: TypeScript(Node.js)[コンテナ]
Docker[IaC]
Terraform[クラウド]
AWS[ライブラリ]
Pyspark, Puppeteer[AIツール]
Cursor, CodeRabbit, Devin【ポジションの魅力】
全プロダクト共通の文書配信システムの開発・運用に携わることで、以下のような経験を積むことができます。・数億件規模の文書データを対象とした、サーバーレス環境における大規模分散処理の設計・開発・運用経験
・数万サイトを対象としたWebクローラーの開発を通じて、Webフロントエンド・バックエンド双方の知見を活かしながら、不安定な外部環境を前提とした監視・運用設計のノウハウを習得
・PdMやCustomer Successチームと連携し、プロダクト要件や顧客課題を踏まえた新規開発・改善提案を主体的に行うことで、技術視点から事業にコミットする経験【会社概要】
ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI LLM技術を活用し、企業の変革を支援しています。
弊社の強みは、フルスクラッチで国産LLMを開発できる技術力です。2024年5月には、国内最大級となる1,000億パラメータの日本語特化LLM「Stockmark-2」を公開しました。
多くの企業が海外モデルの微調整やOSS活用にとどまる中、当社はゼロから自らの手でモデルを設計・構築。日本語とビジネス領域に最適化された性能は、国産最高クラスの水準を誇ります。さらに、ハルシネーションを大幅に抑えており、自社管理下で安全に運用可能です。単なる“生成AIの利用企業”ではなく、“AIそのものを創る企業”として、日本の産業競争力を技術で支えていく存在となることを目指しています。
この技術力を活かして事業展開しており、現在はSaaS事業として製造業向けAIエージェント「Aconnect」、PaaS新規事業として業務AI実装支援プラットフォーム「SAT(Stockmark A Technology)」を運営しています。
創業時からエンタープライズ企業をターゲットとしており、すでに日経225の30%、300社を超える企業様での導入が進んでいます。今後は製造業のR&Dを起点に、国内のエンタープライズ企業はもちろん、日本企業全体そしてグローバル企業にも展開していく予定です。
2024年10月にはシリーズDにて45億円、累計88億円の資金調達を完了。
従業員も150名規模になり、更なる成長を目指すために人員を募集しております! - 企業名
-
ストックマーク株式会社
- 本社所在地
-
東京都港区南青山1 丁目12-3LIFORK MINAMI AOYAMA S209
- 雇用形態
-
正社員
- 各種保険
-
健康保険 雇用保険 厚生年金 労災保険
- 休日休暇
-
完全週休2日制(休日は土日祝日),年末年始休暇,産前産後休暇,育児休暇,有給休暇(入社時付与 ※付与日数は入社月による)
- 情報更新日
-
2026/04/27
AIが推定した求人関連情報
-
数億件規模の大規模データ基盤を担う希少ポジション:
全プロダクト共通の文書配信インフラを担当し、数億件規模の文書データを対象としたサーバーレス分散処理の設計・開発・運用に携われます。市場でも希少な大規模データパイプライン経験を積める環境です。 -
国産最高クラスのLLM開発企業での実務経験:
2024年5月に1,000億パラメータの日本語特化LLM「Stockmark-2」を公開した、フルスクラッチでLLMを開発できる国内有数の技術企業です。AIそのものを創る企業でのエンジニア経験は、強力なキャリア資産となります。 -
Cursor・Devin等の最先端AIツールを活用した開発環境:
開発環境にはCursor、CodeRabbit、Devinといった最先端のAI開発支援ツールを積極活用しており、AIネイティブな開発スタイルで生産性高く業務に取り組める環境が整っています。 -
事業・プロダクトに直結する技術貢献:
PdMやCustomer Successチームと連携し、顧客課題を踏まえた要件定義から実装まで主体的に担える環境です。技術視点から事業成長に直接コミットできるやりがいがあります。 -
シリーズD資金調達済みの成長フェーズスタートアップ:
2024年10月にシリーズDで45億円を調達し、累計88億円超の資金調達を完了。日経225の30%超の企業に導入実績があり、安定した事業基盤のもとでさらなる成長フェーズに挑めます。
以下のいずれかの経験・スキルを有する方を求めています。
- Python・TypeScript(Node.js)を用いたバックエンド開発経験
- Webクローラーまたはデータパイプラインの設計・開発・運用経験
- AWS等クラウドインフラを活用した大規模分散処理の経験
- Docker・Terraformを用いたコンテナ/IaC環境での開発経験
- サーバーレスアーキテクチャ(AWS Lambda等)の設計・実装経験
- PySparkまたは同等の分散処理フレームワークの利用経験
-
自律的なオーナーシップ:
課題を自ら発見し、要件定義から設計・実装・運用までを主体的にリードできる姿勢が求められます。スタートアップの特性上、指示待ちではなく自ら動くマインドが重要です。 -
クロスファンクショナルなコミュニケーション力:
PdM、AIエンジニア、Customer Successなど多様な職種のメンバーと連携しながら開発を進める能力が必要です。技術的な内容を非エンジニアにも分かりやすく伝えるスキルが求められます。 -
不確実な環境への適応力:
外部サイトへのクローリングなど、不安定な外部環境を前提とした設計・監視・運用設計が求められます。想定外の事象が発生しても柔軟に対処できるプロブレムソルビング力が重要です。 -
スケーラビリティ・品質意識:
数億件規模のデータを扱う基盤として、安定性・スケーラビリティ・拡張性を常に意識した設計思想を持てることが必要です。 -
チームの生産性向上へのコミット:
データプラットフォームチームをリードし、チーム全体の生産性最大化にも貢献することが期待されています。技術力だけでなく、チームビルディングへの関心も求められます。
-
Puppeteer等を用いたWebスクレイピング・クローラー開発経験:
PuppeteerやPlaywrightを用いたWebクローラー開発や、JavaScriptレンダリング環境でのコンテンツ抽出に関する実務経験があると即戦力として活躍できます。 -
大規模分散処理の設計・チューニング経験:
PySparkやApache Beam等を用いた数億件規模のデータ処理最適化・チューニングの経験があると、業務への貢献度がより高まります。 -
AI・機械学習プロジェクトへの関与経験:
AI Agentや自然言語処理関連プロジェクトへの関与経験がある方は、プロダクトチームとの連携においてより深い技術的貢献が可能です。 -
SaaS・データプロダクトのインフラ運用経験:
本番環境での監視設計・障害対応・パフォーマンスチューニングの経験を持つ方は、安定した基盤運用においてすぐに活躍できます。
-
大規模データパイプライン設計・運用スキル:
数億件規模の文書データを対象としたサーバーレス環境での分散処理設計・開発・運用経験を実務を通じて深く習得できます。市場価値の高いデータエンジニアリングスキルが身につきます。 -
Webクローラー開発と不安定環境下での監視・運用設計ノウハウ:
数万サイトを対象としたWebクローラーの開発を通じて、フロントエンド・バックエンド双方の知見に加え、外部環境を前提とした堅牢な監視・運用設計スキルを習得できます。 -
AI・LLM関連のデータ基盤構築スキル:
生成AI・LLM開発をプロダクトの核とする企業において、AI Agentのデータ拡充に直結するパイプライン開発を経験することで、AIプロダクト開発の基盤スキルが身につきます。 -
プロダクト横断のテクニカルリーダーシップ:
データプラットフォームチームのリードとして、複数プロダクトに影響する基盤開発をリードする経験を積むことができ、テックリード・エンジニアリングマネージャーへのキャリアパスに直結します。 -
最先端AIツールを活用した開発プロセス設計:
Cursor・CodeRabbit・DevinなどのAIネイティブな開発ツールを日常的に活用する中で、AI駆動開発のベストプラクティスを実践的に習得できます。
- 現在:Software Engineer(Data Platform)
- シニアデータエンジニア 大規模データパイプラインの設計・運用経験を深め、アーキテクチャ全体を主導するシニアポジションへステップアップ。技術的な難易度の高い課題を自律的に解決するエキスパートとして活躍します。
- テックリード(データプラットフォーム) チームの技術方針策定やコードレビュー・設計レビューをリードし、チーム全体の技術力底上げを担うテックリードポジション。エンジニアリング組織の生産性最大化に貢献します。
- エンジニアリングマネージャー データプラットフォームチームのマネジメントを担い、採用・育成・評価・組織設計も含めた組織全体の責任者として事業成長を牽引します。
- VPoE / CTO ストックマーク全体の技術戦略を担う開発責任者ポジション。自社LLM開発を含むAI基盤の強化やグローバル展開に向けた技術組織の構築をリードします。
【ポジティブな評価】
1. 働き方の柔軟性:フルリモートワークとフレックスタイム制の組み合わせで、ワークライフバランスを自分でコントロールしやすい環境として高評価。関東圏外からの勤務も可能で、転居済みメンバーやワーケーション実施者も在籍しています。
2. 個人の裁量と成長環境:自律的に動ける人には幅広い業務・仕組みづくりに携われる環境であり...(ここから先は会員登録後にご覧いただけます。残り342文字)
会員登録をして、
AI 口コミ全貌をチェック!
※本資料はAIを活用して収集・整理した情報を含んでいます。正確性については適宜ご確認ください。