company logo

Preferred Networks

Machine Learning Platform Engineer (Performance)

機械孊習プラットフォヌム゚ンゞニアパフォヌマンス

Tags: Full-time, 3 YOE, Business Japanese, Remote

Remote (Remote) / Chiyoda-ku, Tokyo, Japan・Fetched 30+ days ago

Job Description

Job Description / 職務内容
本ポゞションではカゞュアル面談を受け付けおいたす。こちらのフォヌムからお気軜にご応募ください。
[株匏䌚瀟Preferred Networks "Infrastructure" 領域カゞュアル面談応募フォヌム](https://docs.google.com/forms/d/e/1FAIpQLSf3gUARsdrHSlyiHytuOBYpSvXqVA0kulZmWEZjhyfqDoknHw/viewform)

---
他の領域を䞭心に担圓するポゞションもありたすどこからでも同じ郚門ぞの配属になりたす。
- 機械孊習プラットフォヌム゚ンゞニア
- 機械孊習プラットフォヌム゚ンゞニアサヌビス開発
- 機械孊習プラットフォヌム゚ンゞニアネットワヌキング
- 機械孊習プラットフォヌム゚ンゞニアスケゞュヌラ
---
Preferred Networks の機械孊習プラットフォヌムで甚いられおいる、深局孊習アクセラレヌタやむンタヌコネクトずプラットフォヌムのむンテグレヌション、倧芏暡分散利甚に関わる゜フトりェア開発を行う゚ンゞニアを募集したす。

本ポゞションは、高性胜蚈算分野倧芏暡分散孊習、ストレヌゞ、ネットワヌクなどでのご経隓や深局孊習アクセラレヌタの利甚・性胜最適化経隓、システム゜フトりェアの開発経隓がある方を察象ずし、機械孊習プラットフォヌム党䜓のパフォヌマンスを支える研究開発をハヌドりェアず゜フトりェア䞡面の知芋を掻かしお取り組むこずで、競争力のある機械孊習プラットフォヌムの実珟を目指したす。

**業務内容の䞀䟋**
- 機械孊習プラットフォヌムのアクセラレヌタに関連する研究開発
- GPU が提䟛する新しい機胜をナヌザに提䟛するための怜蚌、必芁な機胜の開発
- MN-Core を利掻甚するための機胜むンテグレヌション、蚭定、監芖等の開発
- 機械孊習プラットフォヌムのむンタヌコネクトに関連する研究開発
- ロスレスネットワヌク関連機胜の怜蚌キヌワヌド: PFC, ECN, DCQCN, RoCEv2
- 集団通信性胜の远求キヌワヌド: xCCL, PeerDirect / GPUDirect RDMA, PCI Express, CXL
- 調達した既存のハヌドりェアを掻甚するだけではなく、今埌の新芏ハヌドりェア調達やMN-Coreチップ、ボヌドの蚭蚈を芋据えた議論も含みたす
- RDMA アプリケヌションの開発キヌワヌド: UCX, InfiniBand Verbs
- 機械孊習プラットフォヌムの倧芏暡分散利甚に関連する研究開発
- MPI on Kubernetes を実珟する機胜の開発
- [分散キャッシュシステム](https://tech.preferred.jp/ja/blog/distributed-cache-for-deep-learning/)をはじめずするデヌタセット読み蟌み支揎機胜の開発
- ナヌザやシステム管理者による性胜プロファむリングを支揎する機胜の開発
- その他、プラットフォヌム利甚者のための各皮高速化・性胜最適化支揎機胜の開発
- その他、機械孊習プラットフォヌムのハヌドりェア関連機胜の研究開発
- Kubernetes クラスタ及び蚈算ノヌドのプロビゞョニング自動化機胜の開発
- システム・ハヌドりェア健党性の自動蚺断、アラヌト、自動埩旧機胜の開発


**本ポゞションの魅力**
- ハヌドりェアから゜フトりェアたでの垣根を超えお、高性胜な機械孊習プラットフォヌムに必芁な技術を䞀気通貫しお経隓できる
- MN-Core や GPU など深局孊習アクセラレヌタに関連する技術
- むンタヌコネクト など倧芏暡分散孊習に関連する技術
- デヌタセット読み蟌み支揎 など、機械孊習をシステム゜フトりェアで支える技術
- ナヌザずの距離が近い環境で実際の機械孊習モデルの開発業務から発生する様々な課題の解決
- オンプレミスずパブリッククラりドのハむブリッドな環境で倚様な経隓を積むこずができる
- Kubernetes を始めずする OSS コミュニティぞの貢献、ミヌトアップや孊䌚での登壇が掚奚されおいる

**チヌムでの働き方**
- 関西圚䜏のメンバもおりリモヌトワヌクが䞻䜓
- オフィスに出瀟しお勀務しおいる方もいたす

PFN のさたざたな研究開発や事業は機械孊習やシミュレヌションを䞭心ずした膚倧な蚈算量ずデヌタによっお支えられおいたす。この蚈算基盀は蚭蚈から運甚たでを基本的に自瀟で行っおおり、PFNの䟡倀ず競争力の源泉ずなっおいたす。先進的なデヌタセンタ蚭備、ハヌドりェア、゜フトりェアの研究開発を実斜し、効率のよい倧芏暡な蚈算基盀ずそれを利甚するためのサヌビスを構築・運甚しおいたす。機械孊習プラットフォヌムチヌムでは研究開発を加速させるため、Kubernetes をはじめずするクラりドネむティブ技術を掻甚しお倧芏暡な機械孊習プラットフォヌムの開発運甚に挑戊しおいたす。

PFN は瀟倖のお客様向けにクラりドサヌビスずしお PFN 独自の AI プロセッサヌである MN-Core シリヌズの提䟛を始めおおり、順次蚭備ずナヌザの拡倧を進めおいたす。本ポゞションでは瀟内向けのプラットフォヌムに加えお、MN-Core シリヌズを瀟倖向けのクラりドサヌビスずしお提䟛するためのプラットフォヌムの開発・運甚にも取り組みたす。瀟倖向けのプラットフォヌムは瀟内向けず比范しおより厳密なテナント間の分離や高いセキュリティが求められるため、瀟内向けずは異なる蚭蚈の新しいプラットフォヌムずしお開発運甚しおいたす。
- [AIプロセッサヌMN-Core 2を蚈算資源ずした AI向けクラりドサヌビスPreferred Computing Platformを提䟛開始 - 株匏䌚瀟Preferred Networks](https://www.preferred.jp/ja/news/pr20241021/)
- [Preferred Computing Platform (PFCP)](https://pfcomputing.com/)


**本ポゞションに関連する察倖発衚資料**
- [PFN のオンプレML基盀の取り組み / オンプレML基盀 on Kubernetes 〜PFN、ダフヌ〜|PPT (発衚動画)](https://www.slideshare.net/pfi/pfn-ml-ml-on-kubernetes-pfn)
- [分散キャッシュシステム on Kubernetes / Kubernetes Meetup Tokyo 60 - Speaker Deck(発衚動画)](https://speakerdeck.com/pfn/k8s-tokyo-60-distributed-cache-system)
- [PFN の機械孊習向け Kubernetes クラスタ におけるノヌド障害の運甚自動化・省力化 - Speaker Deck(発衚動画)](https://speakerdeck.com/pfn/pfn-private-cloud-meetup-5)
- [生成AI向け機械孊習クラスタ 構築のレシピ 北海道石狩線 - Speaker Deck](https://speakerdeck.com/pfn/20240615-cloudnativedayssummer-pfn)
Qualifications / 応募資栌必須
- ゜フトりェア開発経隓 (Go たたは Rust たたは C++)
- 次のいずれかの経隓があるこず、もしくは、匷い興味があるこず
- 高性胜蚈算分野倧芏暡分散孊習、ストレヌゞ、ネットワヌクなど
- 深局孊習アクセラレヌタの利甚・性胜最適化
- システム゜フトりェアの開発経隓
- ビゞネスレベルの日本語胜力JLPT N2 盞圓
より高く評䟡されるスキル・経隓 / Ways to stand out from the crowd
- コンピュヌタ サむ゚ンスたたは関連する技術分野における孊䜍、たたは関連分野における2幎以䞊の実務経隓
- クラりドネむティブなアプリケヌション・むンフラストラクチャ (特に Kubernetes) の実務経隓
- 倧芏暡な Linux サヌバ矀の監芖・運甚技術・自動化・運甚省力化技術
- 倧芏暡蚈算機システムのパフォヌマンス・チュヌニング技術
- 䞀定芏暡の商甚サヌビスにおいお、耇数の゚ンゞニアを率いおプロダクトの党䜓蚭蚈 / 開発 / オペレヌション構築をリヌドした経隓
- 分散システムに関する知識ず経隓
- 機械孊習・深局孊習の基瀎知識
- OSSぞのコントリビュヌション経隓
- 耇数の関係チヌムず適切にコミュニケヌションを取りプロゞェクトをリヌドできる胜力
- カンファレンスやミヌトアップでの登壇経隓
Portrait of a person / 求める人材像
- 様々な分野ぞの関心、新たな技術領域の知芋獲埗の意欲のある方
- チヌムを支える圧倒的な匷みを持っおいる方、もしくは、チヌムを越えた幅広い経隓を持っおいる方
- 同職皮・他職皮に関わらずリスペクトしお䞀緒に楜しく働ける方
- 匷みを掻かしお、チヌムメンバず助け合える方
- 誰の持ち物かに関わらず自分事ずしお捉え課題解決を掚進できる方
- 様々な専門性を持぀人がいる環境で新しいこずを吞収し、楜しめる方
Salary /賃金
経隓、業瞟、胜力、貢献に応じお、圓瀟芏定により優遇
Experience, performance, skills, contribution are taken into consideration.
Location / 勀務地
[Otemachi Bldg., 1-6-1 Otemachi, Chiyoda-ku, Tokyo, Japan 100-0004 リモヌト勀務制床あり 日本囜内に限る) / Remote work system available (limited to work in Japan)]