Research|플래닛 대전
[신입/경력] 강화학습 (RL) 기반 로봇 로코모션 제어 연구원 (Legged robot locomotion)

D-00

2026.06.16 ~

고용형태: 계약직 (평가 후 정규직 전환 가능)

근무지역: 플래닛 대전 (대전시 대덕구 신일서로 125번길 78, 2동 2층)

근무시간: 지정 출퇴근제 (8시~10시 사이 출퇴근 시간 지정하여 9시간 근무 후 퇴근) (휴게시간 1시간 포함)

[담당업무]

1. 강화학습 기반 로코모션 제어 알고리즘 개발

• 다족형(legged) 로봇의 보행/주행 제어 정책(policy) 설계 및 학습

• 다양한 지형·외란 환경에서의 안정적 보행 및 균형 제어 알고리즘 개발

• 강화학습 기반 정책과 모델 기반 제어(MPC/WBC 등)의 결합 및 고도화

2. 시뮬레이션 기반 모델 학습 및 sim-to-real 적용

• 대규모 병렬 시뮬레이션 환경 구축 및 학습 파이프라인 설계

• Domain randomization 등 sim-to-real 격차 완화 기법 적용

• 학습된 정책의 실 로봇 배포 및 실환경 성능 검증·튜닝

3. 연구 성과화 및 협업

• 알고리즘 검증을 위한 실험 설계 및 정량 평가

• 국내외 학회/논문 발표 등 연구 성과 도출

• 펌웨어/제어 팀과의 연계를 통한 실시간 제어 시스템 통합

[자격요건]

• 박사 이상 (로봇공학, 기계공학, 전기전자, 컴퓨터공학, AI관련 분야)

• 신입 및 경력 무관

• 강화학습(RL) 기반 로봇 제어 연구 경험

• 다족형 로봇(사족/이족 등) 제어 연구 또는 프로젝트 경험

• 시뮬레이션 기반 모델 학습 및 sim-to-real 적용 경험

• Python 및 PyTorch(또는 TensorFlow) 기반 모델 개발 역량

[우대사항]

• Isaac Gym / Isaac Sim, MuJoCo, RaiSim 등 대규모 병렬 시뮬레이션 환경 활용 경험

• 사족 보행 로봇(quadruped) 또는 휴머노이드 로코모션 제어 실 로봇 경험

• 모델 기반 제어(MPC, WBC, ZMP 등) 및 동역학 모델링 역량

• Domain randomization, teacher-student, privileged learning 등 sim-to-real 기법 활용 경험

• 실시간 제어 시스템 및 액추에이터/모터 제어에 대한 이해

• 거친 지형·고속 주행·외란 회복 등 robust locomotion 연구 경험

[지원 시 유의사항]

• 서류 검토는 1~2주 정도 소요되며, 서류 합격자에 한하여 순차적으로 연락 드립니다.

• 전형 결과 정규직 전형 불합격자 중 필요 시, 후보자에게 동의를 받아 계약직 전형으로 검토될 수 있습니다.

Research|플래닛 대전[신입/경력] 강화학습 (RL) 기반 로봇 로코모션 제어 연구원 (Legged robot locomotion)