고양이 음성 번역 앱은 어떻게 작동합니까?

고양이 음성 번역 앱은 어떻게 작동합니까?

고양이가 하는 말을 번역한다고 주장하는 앱을 본 적이 있을 것입니다. 그러나 그들은 정말로 고양이의 야옹을 영어로 번역할 수 있습니까? 짧은 대답은 예입니다. 각 고양이의 '언어'가 독특하기 때문에 어렵지만 현대 기술로 꽤 가까이 갈 수 있습니다.





MeowTalk와 같은 고양이 번역 앱은 기계 학습을 강조하는 음성 인식 형식을 사용합니다. 더 자세히 살펴보겠습니다.





음성 인식 및 기계 학습

메리 테레사 맥린/ Pixabay





음성 인식은 음성을 녹음하고 오디오를 디지털 데이터 파일로 바꾸는 방식으로 작동합니다. 앱이 분석하고 의미와 일치시킬 수 있는 데이터 포인트로 음높이 및 음량과 같은 데이터를 인코딩합니다. DPA 마이크 이러한 데이터 포인트는 배경 소리와 단어를 말하는 방식에 따라 매우 다르게 보일 수 있다고 설명합니다.

우리는 때때로 음성 인식을 당연하게 여겼지만, 이는 놀라운 기술의 위업입니다. 특히 인간의 언어가 얼마나 복잡한지를 고려하면. 같이 과학자 각 단어는 서로 혼합된 광범위한 소리 또는 '음소'를 포함한다고 설명합니다. 컴퓨터가 말을 이해하게 하는 것은 매우 어렵습니다. 고양이 소리의 새로운 지평은 더욱 어려워질 것입니다.



음성 인식을 사용하는 앱은 데이터세트라는 단어의 '어휘'로 프로그래밍됩니다. 그런 다음 앱은 데이터 어휘에서 가장 가까운 옵션과 음성을 일치시킵니다.

오류가 발생하면 수정하고 다음을 위해 해당 데이터를 저장합니다. 이것은 기계 학습의 일부입니다. 이는 프로그램이 시작한 데이터 세트와 동일하지 않은 경우에도 음성 인식을 학습하는 방법입니다.





관련: 기계 학습 알고리즘이란 무엇입니까? 작동 방식은 다음과 같습니다.

음성 인식은 여전히 ​​문제, 특히 언어 장애 및 억양 문제가 있습니다. 그러나 일부 회사는 이러한 문제를 극복하기 위해 기계 학습을 개선하고 있습니다. 시간이 지남에 따라 기계 학습은 음성 인식을 강력한 도구로 바꿀 수 있습니다.





누군가가 귀하의 컴퓨터에 원격으로 액세스하고 있는지 확인하는 방법

이것이 인간에게 음성 인식이 작동하는 방식입니다. 그러나 고양이에게 효과가 있습니까?

음성 인식 대 야옹 인식

아리아나 수아레스 / 언스플래쉬

먼저, 특정 종류의 야옹을 '배가 고프다'로 번역하는 것이 사람의 말을 분석하는 것과 왜 다른지 이해해야 합니다. 문제는 고양이의 의사소통이 자세와 같은 비언어적 신호에 더 많이 의존한다는 것입니다. 또 다른 문제는 보편적인 '고양이 언어'가 없다는 것입니다.

에 따르면 ASPCA , 성인 들고양이는 서로에게 절대 야옹하지 않고 오직 사람에게만 야옹을 합니다. 다른 연구 인간사회 그 소리는 '진공 상태에서 발생하지 않습니다.' 우리는 그것들을 신체 언어 및 기타 맥락과 함께 해석해야 합니다. 많은 경우 이러한 무음 신호는 '배고프다'를 의미하는 야옹과 '놀고 싶다'는 의미의 야옹 사이의 유일한 차이점입니다.

이 문제에 더하여 두 고양이는 같은 언어를 사용하지 않습니다. 고양이는 주인을 위해 개인화된 '언어'를 개발합니다. 이것은 부분적으로는 주인의 목소리를 모방하고 부분적으로는 고양이의 성격을 모방한 것입니다. 같은 욕구나 필요를 전달할 때에도 같은 소리를 내는 고양이는 없습니다. 그렇다면 한 앱의 음성 어휘는 어떻게 모든 앱을 번역할 수 있습니까?

고양이를 위한 유연한 기계 학습

무료 사운드/ 언스플래쉬

비록 몇몇 가상 비서가 자동 어조와 감정을 이해하려는 시도에도 불구하고 음성 인식은 여전히 ​​비언어적 신호에서 끔찍합니다. 그러나 그것이 그것들을 해석하는 것이 불가능하다는 것을 의미하지는 않습니다.

windows 스토어 windows 10에 연결할 수 없습니다

MeowTalk는 이러한 문제를 극복하는 데 도움이 되는 보다 유연한 종류의 기계 학습을 사용합니다.

다운로드: 에 대한 MeowTalk 기계적 인조 인간 | iOS (무료)

Meowtalk는 Alexa 팀에서도 일한 Javier Sanchez가 만들었습니다. 그는 앱이 스마트 칼라를 향한 한 걸음이라고 상상했습니다. 이 목걸이는 고양이 소리를 인간의 말로 번역하여 인간이 고양이를 더 잘 이해하고 돌볼 수 있도록 돕는 복잡한 기계 학습 전략을 사용합니다.

MeowTalk 팀은 각 고양이에 대해 보다 구체적인 프로필을 만들어 고유성 문제를 보완했습니다. 앱에서 각 고양이를 별도로 등록합니다. 과학 노르웨이 새끼 고양이는 성인 고양이와 다른 방식으로 야옹 소리를 낸다고 보고하기 때문에 앱은 고양이의 생일도 묻습니다. 각 프로필은 기계 학습에 약간의 딥 러닝을 통합하여 고양이를 위한 고유한 데이터 네트워크를 생성합니다.

관련: 딥 러닝 vs. 머신 러닝 vs. AI: 어떻게 함께 가나요?

어휘의 경우 MeowTalk는 데이터 세트에서 10개의 사운드 프로필로 시작합니다. 각각 '행복하다' 또는 '사냥하다'와 같이 다른 의미가 붙어 있습니다. 앱이 소리를 듣고 잘못 이해하면 수정하거나 새로운 해석을 만들 수 있습니다.

에서 수집한 CATSOUNDS 데이터 아크벨론

수정은 기본 어휘를 새 소리로 바꾸도록 앱에 지시합니다.

최고의 무료 TV 및 영화 앱

예를 들어, 긴 울음 대신 짧은 짹짹 소리에 '사냥'을 일치시키도록 앱에 지시할 수 있습니다. 이러한 종류의 수정은 음성 인식 방식으로 하나의 의미와 일치시키기 위해 여러 소리를 추가하는 것보다 더 유용합니다. 둘 다 '마더 콜'을 의미합니다.

음성 인식 앱의 기계 학습은 일반적으로 이러한 유형의 덮어쓰기에 저항합니다. 그것은 Siri에게 '기술 블로그'라고 말하면 실제로는 '배'를 의미한다고 가르치는 것과 같습니다. 그러나 MeowTalk가 사용하는 보다 유연한 형태의 기계 학습은 이러한 수정을 더 쉽게 처리할 수 있습니다.

새로운 해석을 생성하면 이전에 인코딩되지 않은 의미가 추가됩니다. 예를 들어 고양이가 좋아하는 장난감을 원할 때 특정 전화를 걸면 '내 마우스를 원합니다'를 옵션으로 추가할 수 있습니다. 자동 고침 사전에 단어를 추가하는 것과 비슷합니다.

관련된: Android에서 자신만의 자동 고침 단어를 정의하는 방법

시간이 지남에 따라 고양이를 위한 고도로 개인화된 음성 프로필을 개발할 수 있습니다. 결국, 애완 동물을 돌보거나 행동 문제를 해결하는 데 유용할 만큼 정교할 수도 있습니다. 다른 것이 아니라면 고양이 주인이 애완 동물에게 더 세심한주의를 기울이는 데 도움이됩니다.

평결: 고양이 번역 앱이 작동합니까?

결국 '고양이 번역'은 여전히 ​​사용자가 앱에서 고양이가 말하는 방식을 가르치는 것에 크게 의존합니다. 각 고양이의 의사 소통이 얼마나 독특하기 때문에 항상 그럴 것입니다.

그러나 기계 학습이 지금까지 발전하여 개발자가 부분적으로라도 성공할 수 있다는 사실은 놀랍습니다. 머신 러닝과 AI는 엄청난 속도로 발전하고 있으며 다음 단계가 기대됩니다.

공유하다 공유하다 트위터 이메일 관련 항목
  • 기술 설명
  • 언어 학습
  • 기계 학습
저자 소개 나탈리 스튜어트(47건의 기사 게재)

Natalie Stewart는 MakeUseOf의 작가입니다. 그녀는 대학에서 처음으로 기술에 관심을 갖게 되었고 대학에서 미디어 쓰기에 대한 열정을 키웠습니다. Natalie는 접근 가능하고 사용하기 쉬운 기술에 중점을 두고 있으며 일상적인 사람들의 삶을 더 단순하게 만드는 앱과 장치를 좋아합니다.

나탈리 스튜어트가 참여한 작품 더보기

뉴스레터 구독

뉴스레터에 가입하여 기술 팁, 리뷰, 무료 전자책 및 독점 거래를 확인하십시오!

구독하려면 여기를 클릭하세요.