崗位職責(zé)
1. 參與AI模型服務(wù)平臺的核心設(shè)計與開發(fā),如模型推理服務(wù)平臺核心能力搭建及各類管理功能;
2. 參與平臺管理后臺及相關(guān)配置界面開發(fā),實現(xiàn)模型部署服務(wù)監(jiān)控資源調(diào)度等功能的可視化管理,提升操作便捷性;
3. 持續(xù)跟進(jìn)AI Infra及大模型應(yīng)用相關(guān)開源項目,評估技術(shù)可行性,快速集成適配平臺的輕量化技術(shù)方案;
4. 基于Docker/K3s環(huán)境,編寫自動化腳本,完成裸金屬服務(wù)器的環(huán)境檢測系統(tǒng)初始化及模型運行環(huán)境的標(biāo)準(zhǔn)化配置。
崗位要求
1. 熟悉Python或Go編程語言,具備2年以上服務(wù)端開發(fā)經(jīng)驗,能獨立完成后端模塊開發(fā)API設(shè)計與調(diào)試,具備良好的系統(tǒng)設(shè)計與邏輯抽象能力;
2. 熟悉Docker容器化技術(shù),了解K3s/Kubernetes基礎(chǔ)使用,具備容器化環(huán)境下的開發(fā)部署與問題調(diào)試經(jīng)驗;
3. 了解大模型推理服務(wù)或AI應(yīng)用的基本原理,有相關(guān)項目實踐經(jīng)驗者優(yōu)先;具備良好的工程習(xí)慣,能獨立推進(jìn)功能開發(fā),并完成相關(guān)技術(shù)文檔編寫;
4. 具備較強的問題排查能力,能快速定位并解決開發(fā)部署過程中的環(huán)境代碼相關(guān)問題。
加分項
1. 深入使用或研究過vLLMllama.cppFastChat等模型服務(wù)項目;具備GPU服務(wù)器運維CUDA環(huán)境配置或AI推理/訓(xùn)練環(huán)境調(diào)優(yōu)經(jīng)驗;
2. 參與過平臺型系統(tǒng)調(diào)度系統(tǒng)或資源管理類系統(tǒng)的設(shè)計與實現(xiàn),有相關(guān)架構(gòu)設(shè)計或核心模塊開發(fā)經(jīng)驗;
3. 使用過RAGAgent或工作流相關(guān)框架(如DifyLangChain等),有大模型應(yīng)用開發(fā)經(jīng)驗者優(yōu)先;
4. 具備全棧開發(fā)能力,熟悉React/Vue等前端框架及現(xiàn)代前端工程化,能獨立完成簡單前端頁面開發(fā);
5. 熟悉Linux系統(tǒng)運維,,掌握Linux自定義鏡像封裝(適配GPU及模型運行場景)。
舉報
1. 參與AI模型服務(wù)平臺的核心設(shè)計與開發(fā),如模型推理服務(wù)平臺核心能力搭建及各類管理功能;
2. 參與平臺管理后臺及相關(guān)配置界面開發(fā),實現(xiàn)模型部署服務(wù)監(jiān)控資源調(diào)度等功能的可視化管理,提升操作便捷性;
3. 持續(xù)跟進(jìn)AI Infra及大模型應(yīng)用相關(guān)開源項目,評估技術(shù)可行性,快速集成適配平臺的輕量化技術(shù)方案;
4. 基于Docker/K3s環(huán)境,編寫自動化腳本,完成裸金屬服務(wù)器的環(huán)境檢測系統(tǒng)初始化及模型運行環(huán)境的標(biāo)準(zhǔn)化配置。
崗位要求
1. 熟悉Python或Go編程語言,具備2年以上服務(wù)端開發(fā)經(jīng)驗,能獨立完成后端模塊開發(fā)API設(shè)計與調(diào)試,具備良好的系統(tǒng)設(shè)計與邏輯抽象能力;
2. 熟悉Docker容器化技術(shù),了解K3s/Kubernetes基礎(chǔ)使用,具備容器化環(huán)境下的開發(fā)部署與問題調(diào)試經(jīng)驗;
3. 了解大模型推理服務(wù)或AI應(yīng)用的基本原理,有相關(guān)項目實踐經(jīng)驗者優(yōu)先;具備良好的工程習(xí)慣,能獨立推進(jìn)功能開發(fā),并完成相關(guān)技術(shù)文檔編寫;
4. 具備較強的問題排查能力,能快速定位并解決開發(fā)部署過程中的環(huán)境代碼相關(guān)問題。
加分項
1. 深入使用或研究過vLLMllama.cppFastChat等模型服務(wù)項目;具備GPU服務(wù)器運維CUDA環(huán)境配置或AI推理/訓(xùn)練環(huán)境調(diào)優(yōu)經(jīng)驗;
2. 參與過平臺型系統(tǒng)調(diào)度系統(tǒng)或資源管理類系統(tǒng)的設(shè)計與實現(xiàn),有相關(guān)架構(gòu)設(shè)計或核心模塊開發(fā)經(jīng)驗;
3. 使用過RAGAgent或工作流相關(guān)框架(如DifyLangChain等),有大模型應(yīng)用開發(fā)經(jīng)驗者優(yōu)先;
4. 具備全棧開發(fā)能力,熟悉React/Vue等前端框架及現(xiàn)代前端工程化,能獨立完成簡單前端頁面開發(fā);
5. 熟悉Linux系統(tǒng)運維,,掌握Linux自定義鏡像封裝(適配GPU及模型運行場景)。
舉報
溫馨提示
- 你可能感興趣的職位
- 最近瀏覽記錄
-
4.5-5.9K/月
-
10-14.9K/月
-
4-7K/月
-
30-40K/月
-
面議
-
面議
-
面議
-
面議
暫沒有相關(guān)信息
- 公司規(guī)模:100-499人
- 公司性質(zhì):0
- 所屬行業(yè):電力、電氣、自動化、熱力、鍋爐、照明、電池、電源、電纜、光電等
- 聯(lián)系人:黃丹琪
- 手機:會員登錄后才可查看
- 郵箱:會員登錄后才可查看
- 郵政編碼:
工作地址
- 地址:深圳市南山區(qū)粵海街道盈峰中心16樓
HR問答
查看更多






