OpenAI는 프롬프트와 명령에 응답하기 위해 ChatGPT에 음성을 제공합니다.

OpenAI는 프롬프트와 명령에 응답하기 위해 ChatGPT에 음성을 제공합니다.
당신과 같은 독자들이 MUO를 지원하는 데 도움을 줍니다. 귀하가 당사 사이트의 링크를 사용하여 구매하면 당사는 제휴 수수료를 받을 수 있습니다. 자세히 읽어보세요.

ChatGPT는 대화형 생성 AI 경험이 되도록 설정되었습니다. OpenAI는 세계 최고의 AI 챗봇이 AI 생성으로 추정되는 합성 음성을 사용하여 사용자 쿼리에 말하고 응답할 수 있을 것이라고 밝혔습니다.





ChatGPT는 새로 발견된 음성과 함께 ChatGPT Android 또는 iOS 앱을 사용하는 동안 업로드되거나 찍은 특정 이미지에 응답하고 토론할 수도 있습니다. 이미지 인식 기능은 데이터와 정보를 정확하게 감지하기 위해 신경망을 사용하는 Google Lens 및 기타 앱과 유사하게 들립니다.





OpenAI는 ChatGPT에 음성을 제공합니다

2023년 9월 25일 ChatGPT 개발자 OpenAI 공개 세계 최고의 생성 AI 챗봇이 목소리를 낼 수 있게 될 것입니다. ChatGPT 사용자는 챗봇에게 직접 말하고 답장을 요청할 수 있으므로 ChatGPT가 처음으로 음성으로 직접 대화할 수 있습니다.





OpenAI의 예시 클립에는 ChatGPT에 독특한 취침 시간 이야기를 만들어 달라고 요청하는 여성이 등장하며, ChatGPT는 이에 대해 여성 합성 음성으로 적절하게 응답합니다.

에 따르면 열광한 , 새로운 텍스트 음성 변환 모델이 사내에서 개발되었습니다. 텍스트와 몇 초의 샘플 음성에서 '인간과 유사한' 오디오를 생성할 수 있습니다( OpenAI Whisper 모델 사용 ) 다양한 어조와 스타일로 말합니다. 다양한 음성 샘플을 찾을 수 있습니다. OpenAI 블로그 .



Windows 7 부팅 USB를 만드는 방법

일부 회사에서는 이미 OpenAI의 새로운 음성 모델을 사용하고 있습니다. 예를 들어 Spotify는 OpenAI의 텍스트 음성 변환 모델을 사용하여 ChatGPT의 언어 번역 능력과 새로운 말하기 능력을 결합하여 팟캐스트를 다른 언어로 번역하고 있습니다.

ChatGPT의 새로운 텍스트 음성 변환 모델은 공식 Android 및 iOS 앱을 사용하는 Plus 및 Enterprise 구독자에게만 제공되며 앞으로 2주 이내에(2023년 9월 25일부터) 출시될 예정입니다. 게다가, 새로운 음성 기능은 처음에는 영어로 제한되어 있지만 이것이 빠르게 바뀔 것으로 예상됩니다.





ChatGPT는 인식하고 사진을 찍을 수 있습니다

OpenAI ChatGPT 업데이트의 두 번째 부분은 도구에 업로드된 이미지를 분석하고 대화하는 기능입니다. 시각적 이미지 분석 옵션은 GPT-4 업데이트 영상에 등장했지만 그 이후로는 많이 논의되지 않았습니다( ChatGPT 코드 통역사는 제쳐두고 ).

이제 ChatGPT는 Google Lens와 유사한 기능을 제공합니다. ChatGPT에 이미지를 업로드하거나 ChatGPT 앱에서 스마트폰 카메라를 사용하여 사진을 찍을 수 있으며, 필요한 경우 더 많은 맥락을 추가하여 이미지를 자세히 설명합니다.





누가 내 집을 지었는지 알아내는 방법

이를 '구글 렌즈와 유사하다'라고 부르는 것은 정말 불공평합니다. 더 많은 정보와 맥락을 얻기 위해 이미지에 관해 대화를 나눌 수 있는 기능은 광범위한 설정에 매우 유용합니다. 그러나 OpenAI는 개인정보 보호 및 정확성을 이유로 ChatGPT의 '사람에 대해 분석하고 직접 진술하는 능력'을 제한했음을 분명히 밝혔습니다. 그럼에도 불구하고 OpenAI 기반의 '이 사람은 누구입니까?' 도구가 미래에 사용될 수 있을까요? (그렇지 않길 바라자!)

새로운 텍스트 음성 변환 모델과 마찬가지로 OpenAI는 ChatGPT 앱뿐만 아니라 모든 플랫폼에서 사용할 수 있지만 앞으로 2주 안에 이미지 인식 기능을 출시할 예정입니다.

개인 정보 보호, 보안 및 기타 문제

음성 기반 ChatGPT의 의미는 뚜렷합니다. 물론이죠. 흥미롭습니다. 그러나 예를 들어 짧은 스니펫을 사용하여 고유하게 합성된 음성을 생성하는 기능은 상당한 개인 정보 보호 및 보안 문제를 안고 있습니다. 악의적인 행위자가 이러한 도구를 악용할 가능성은 엄청나며 모든 생성 AI 도구와 마찬가지로 지니가 병에서 나오면 절대 다시 들어가지 않습니다. 정부나 사고 리더의 AI 규제가 아무리 많아도 되돌릴 수 없습니다. 조수.

이 주제에 대한 OpenAI의 경고조차도 문제를 언급했음에도 불구하고 명백한 것을 피하는 것 같습니다.

그러나 이러한 기능은 악의적인 행위자가 공인을 사칭하거나 사기를 저지를 가능성과 같은 새로운 위험도 제시합니다. 이것이 바로 우리가 이 기술을 사용하여 특정 사용 사례인 음성 채팅을 지원하는 이유입니다.

이것이 빙산의 일각이라는 점을 감안할 때, 특히 ChatGPT가 사기 등을 저지르는 데 사용되고 있다고 주장하는 불미스러운 헤드라인이 예측 가능한 수준으로 증가하는 경우 ChatGPT의 새로운 목소리에 대한 반발이 예상됩니다.

OpenAI는 ChatGPT를 AI 앱으로 만들고 있습니다

OpenAI가 ChatGPT에 사용자 친화적인 기능을 더 많이 추가할수록 더 많이 사용되는 생성 AI 앱이 됩니다. 초기 생성 AI 붐 동안 처음으로 광범위한 명성을 얻은 ChatGPT는 Google Bard(및 잠재적으로 Google Gemini) 및 Anthropic's Claude와 같은 경쟁에도 불구하고 여전히 선두를 달리고 있으며 일부 사용되는 유일한 앱입니다.

OpenAI가 ChatGPT를 더 쉽게 사용할 수 있도록 하는 기능을 계속 추가할 수 있는 한, 사람들을 계속 매료시키고 진정한 다중 모드 AI 도구라는 목표에 더욱 가까이 다가갈 수 있을 것입니다.