ChatGPT의 강력한 기능으로 인해 많은 기술 회사가 로봇 본체를 제공하는 것과 같은 응용 프로그램 경계를 탐색하고 싶어합니다. 어떤 종류의 놀라움을 가져올 수 있습니까?
며칠 전 마이크로소프트는 공식 웹사이트에 기술적인 글을 게재해 마이크로소프트가 컴퓨터의 한계를 뛰어넘어 로봇을 제어해 현실 세계에서 자유로운 역할을 할 수 있도록 챗GPT를 시도하고 있다고 소개했다.
기사 내용에 따르면 마이크로소프트는 ChatGPT의 기능을 로봇 분야로 확장하고 언어를 사용해 로봇 팔, 드론, 홈 어시스턴트 로봇 등 여러 플랫폼을 직관적으로 제어할 예정이다.
예를 들어, 홈로봇에게 "내 점심을 데워주세요"라고 말하면 홈로봇은 전자레인지를 찾아 스스로 식사를 데울 것이다. 이것은 분명히 우리의 이상적인 로봇입니다. 우리처럼 로봇에게 우리 자신의 말로 무엇을 할지 지시할 수 있습니다. 다른 사람과 의사소통하는 것만큼 쉽습니다.
언어는 우리의 의도를 표현하는 가장 간단하고 직관적인 방법이지만 이제 우리는 로봇을 제어하기 위해 코드 작성에만 의존할 수 있으며 의심할 여지 없이 작업을 훨씬 더 복잡하게 만들고 Microsoft 팀은 현재 이 현실을 바꾸는 방법을 모색하고 있습니다. OpenAI의 새로운 AI 언어 모델인 ChatGPT를 사용하여 자연스러운 인간과 컴퓨터의 상호 작용을 가능하게 합니다.
로봇에 ChatGPT 적용
ChatGPT는 광범위한 프롬프트 및 질문에 대해 일관되고 문법적으로 올바른 응답을 생성할 수 있도록 대규모 텍스트 및 인간 상호 작용에 대해 훈련된 언어 모델입니다. ChatGPT를 사용하여 로봇을 제어하여 작업을 완료하려면 물리적 세계를 추론하기 위해 텍스트를 넘어 생각하게 만드는 것이 필요합니다.
마이크로소프트 연구원들은 "이 연구의 목표는 ChatGPT가 로봇이 작업을 완료하도록 돕기 위해 텍스트 생성 및 실제 조건에 대한 추론의 범위를 넘어설 수 있는지 확인하는 것"이라고 말했습니다. Microsoft는 복잡한 프로그래밍 언어나 로봇 시스템에 대한 자세한 정보를 배우지 않고도 사람들이 로봇과 보다 쉽게 상호 작용할 수 있기를 희망합니다.
로봇 사용의 현재 기반은 작업 요구 사항을 시스템 코드로 변환할 수 있는 엔지니어 또는 기술 사용자입니다. 엔지니어는 로봇 동작을 수정하기 위해 새 코드와 사양을 자주 작성해야 합니다. 이 프로세스는 느리고(사용자가 낮은 수준의 코드를 작성해야 함) 비용이 많이 들고(로봇 공학에 대한 깊은 지식이 있는 고도로 숙련된 사용자가 필요함) 비효율적입니다(일을 작동시키기 위해 여러 상호 작용이 필요함).
ChatGPT는 자연어를 코드로 빠르게 변환할 수 있는 새로운 로봇 패러다임을 열어 비전문가도 로봇의 성능을 모니터링하면서 대규모 언어 모델(LLM)에 대한 고급 피드백을 제공할 수 있습니다. 이를 바탕으로 마이크로소프트는 어떤 경우에도 미세 조정을 하지 않고 LLM의 지식을 활용하여 다양한 형태의 로봇을 제어하여 다양한 작업을 수행합니다.
현재 실험에서는 ChatGPT 대화 상자에 명령을 입력하여 로봇이 "건강 음료", "설탕과 빨간색 표시가 있는 것"(이 경우에는 콜라 캔)을 찾도록 제어할 수 있었던 것으로 파악됩니다. 방. , 드론 셀카용 거울.
실제로 ChatGPT는 자체적으로 많은 작업을 수행할 수 있지만 특수 프롬프트 구조, 고급 API 및 텍스트를 통한 사람의 피드백을 포함하되 이에 국한되지 않는 몇 가지 기술적 개선이 필요합니다. Microsoft는 현재의 노력이 봇 시스템을 개발하는 방식의 변화일 뿐이라고 믿습니다. 시작했으며, 더 많은 연구자들이 이 흥미진진한 분야에 진출하기를 바랍니다.
