[음악 재생] 데이비드 마란 :이 CS50입니다. 이것은 (10)의 주 단부이다. 그리고 소년, 우리는이 있습니까 당신을 위해 좋은 수업 오늘. 우리는 두 가지를 초대 너무 흥분 오늘 우리에게까지 예일대에서 우리의 친구 그리고 교차 보는 인공 지능, 로봇 공학, 자연어 처리, 등. 그리고 실제로, 이상 지난 몇 주, 우리는했습니다 확실히, 많은 시간을 보냈다 특히 이전의 Pset에, 꽤 낮은 수준의 세부 사항에 집중. 그리고 시력을 잃게하는 것은 매우 쉽다 나무의 숲 그리고 루프와 조건에 매달릴 확실히 포인터 등을 포함한다. 그러나 현실은 너희들이 지금이입니다 재료있는 당신은 정말 할 수 중, 몇 가지 흥미로운 문제를 해결 예일에서 그 사람들은 우리의 친구 캠브리지 단지 수줍음에 작동합니다. 그래서 내가 먼저 우리의 머리를 소개 할 수 있도록 예일, 앤디에서 보조 교육. [박수 갈채] 앤디 : 우선, 단지 감사 몇 Yalies을 허용하는 당신 오늘 캠브리지 아래에 팝업합니다. 우리는 정말 감사. 둘째, 우리의 친구 다시, 제이슨 home-- 체류 및 강의를 실행하기위한 감사합니다. 이 뉴 헤이븐에있는 모든 좋은 바랍니다. 그래서 그래, 나는 매우 흥분 오늘 Scaz을 소개합니다. Scaz은 로봇 실험을 실행합니다. 그는 다섯, 같은 교수의 예일에서 다른 부서. 그의 연구실에서 그는 많은, 많은이 그는 놀이를 좋아하는 로봇. 그는, 등이있다 세계에서 가장 멋진 일. 그리고 그는 엉망 가지에 도착 주변의 모든 일에 길고 몇 가지 작업을 수행 할뿐만 아니라. 그래서 우리는 실제로 하나를 가져왔다 오늘 우리와 함께 그들을의. 그래서 속히, Scaz입니다 가서 우리를 소개 할 예정 그의 로봇 친구. [박수 갈채] 브라이언 SCASSELLATI : 감사합니다, 데이비드. 감사합니다, 앤디. 그것은 될 정도로 훌륭합니다 여기에 모든 사람이 오늘과. 내가 먼저 아주 명확 할 캠브리지 여기 CS50 직원 우리에게 매우 친절했다. 우리는 모든 것에 너무 감사 그들은 우리를 지원하기 위해 수행했습니다. 그래서 우리는 수 있도록하고 싶습니다 친절을 반환합니다. 그래서 오늘, 우리는 발표 할 수 우리는 새로운이 거라고, 한 종류의 CS50 이벤트 다음 주 뉴 헤이븐에서 일어나는. 그리고 이것은 CS50 연구 엑스포입니다. 그래서 우리는 초대 할거야 everyone-- CS50 학생, 하버드와 Yale--에서 모두에 직원 와서 금요일에 우리와 함께하시기 바랍니다. 우리는 이상의 다양한있을 것이다 제시 (30) 다른 사람 그리고 exhibiting-- 남문 게재 연구 제품의 일부 해제합니다. 우리는 심지어, 찾고, 일부 신생있을 것이다 새로운 기술 인재의 작은 비트, 하버드와 예일에서 모두 신생. 그리고 우리는 어떤 학생 그룹이있을 것이다 새로운 회원을 찾고. 그것은 매우 흥미로운 시간이 될거야. 누가 당신의 희망이 그 하버드 - 예일 게임을 내려오고 중지 할 수있을 것입니다 초기에 약간에 의해, 바로 캠퍼스의 중앙에, 스털링 기념 도서관. 우리는 세트를 할거야 자율 범위 전시 소프트웨어를 사용하는 방법에 요트 중세의 사본을 보존한다. 우리는 광고를 할 겁니다 혹 네트워킹과 사람들 케이프 타운에서 소프트웨어 코딩을 가르치는. 우리는 컴퓨터를 할 것이다 음악 시위. 그리고 우리는 물론 더 많은 로봇을해야합니다. 우리는 당신이 희망 않도록거야 이 이벤트에 대한 우리와 함께. 그것은 많이해야 재미, 음식의 약간, 흥미로운 많은 것들에 대해 이야기. 그래서 오늘, 우리는 이야기거야 자연 언어 처리에 대한. 그리고 이것은 우리의 시도이다 인터페이스의 새로운 방법을 구축 우리의 장치 때문에와 지난 몇 주 동안, 당신은 그 방법에 초점을 맞추고 있었어요 당신은 소프트웨어를 작성, 코드를 작성할 수 있습니다 그에게 말을 할 수있는 하나의 방법입니다 기계는이 내가 당신이 원하는 것입니다. 그러나 우리는 할 필요가 없습니다 모든 것이 예상 즉, 거기있어 그 사용되는 세계의 모든 사람 실력이 될 것입니다 명령의 종류. 그래서 우리는 컴퓨터를 구별 언어와 자연 languages​​-- 즉, 사용을 인간 것들 다른 사람과 통신합니다. 그리고 우리가 사용하는 인터페이스를 구축하려고 이러한 자연의 통신 메커니즘. 이제, 단지 다른 모든 항목을 좋아 우리가 CS50에서 시작했는지, 우리는 간단한 시작하는거야 자연 언어 처리의 비트 우리는 상상할 수있다. 우리는 시작하는거야 자연 언어의 역사적인 부분. 그리고 우리는에 구축 할 것이다 더욱 최근 시스템 그리고 그 길을 따라 재미 데모를 가지고있다. 그래서 우리는 무엇부터 시작하는거야 아마 최초의 자연 언어 처리 시스템. 이렇게 작성된 소프트웨어 시스템이었다 조셉 바이 첸 바움에 의해 1966 엘리자를했다. 그리고 엘리자를 위하여 디자인되었다 상호 작용의 종류를 복제 당신과 함께 할 것이다 하여 로저 심리 치료사. 이제 Rogerians, 그들은 있었다 생각이 심리 치료 다시 반영 할 수있는 참여 그들에게 환자와 이야기에, 기본적으로 그들 만주는 치료사의 작은 조금. 즉, 모든 것 치료사가 말했다 단지 반영해야했는데 어떤 환자는 그들에게 말하고 있었다. 그래서 시도하고이 데모 할 수 있습니다. 우리는 될 거라고 자원 봉사자가 있습니까 자신의 깊은을 공유하고자, 엘리자와 어두운 및 / 또는 가짜 비밀? 물론, 당신은 왜 최대에 오지 않는다. 환상적인. 그리고 당신의 이름은? MILES : 마일. 브라이언 SCASSELLATI : 마일. , 마일을 만나서 반갑습니다. 당신은 지키고 싶다면. 그리고 우리는 갈거야 엘리자의 버전을 사용 우리는 복제 한 것을 CS50의 IDE 내. 그리고 우리는 소스에 대해 알아 보겠습니다 잠시 동안이 코드. 하지만 지금, 우리는 그냥있어 엘리자를 입력하여 호출하는 것. 그리고 엘리자 당신에게 응답을 줄 것입니다 그 모든 수도있을 것입니다. 그리고 당신에게 몇 가지 질문을 할 것. 그리고 우리가 응답하고 입력합니다 엘리자에 대한 응답이다. 그래서 엘리자 안녕, 나는 엘리자 해요 "라고했다. 무엇이 문제입니다?" 당신은 싶은 것이 오늘에 대해 엘리자에게? 마일 : 난 단지 잠들 수 나는 토끼 슬리퍼에있는 경우. 브라이언 SCASSELLATI : 좋아. 괜찮아. [웃음] "나는 단지 잠들 수 에 토끼 슬리퍼. " 그리고 엘리자가 말한다 "라고, 당신을 어떤 심리적 문제가? 어쩌면 이것은 좋은 지표입니다. " 그래. 그래서 당신은 응답 하시겠습니까? MILES : 예. 브라이언 SCASSELLATI : 예. 많은 단어의 남자. 나는 그것을 즐길 수 있습니다. 엘리자는 "당신은 매우 긍정적 인 것 같다"라고 말한다. 마일 : 아니, 나는 사실, 전자. 브라이언 SCASSELLATI : "아니오. 사실, 나는 전자입니다. " "당신은 나에게 왔을 까 당신이 전자 때문에? " 이제, 우리는 몇 가지를 볼 수 있습니다 내가 갈거야 things-- 단지 잠시 마일을 일시 정지합니다. 어디 가지 마. 우리는 아직 당신과 함께 끝나지 않았습니다. 엘리자는 어떤면에서,, 어떤 일에 응답 그는없이 말을하지만 그건 그 실제 이해. 그리고 그것은 또한 일부를 다시 앵무새있어 그의 문장의 부분. 그래서 우리는 호 "고 말했다 사실, 나는 전자입니다. " 엘리자는 "당신이 왔을 까, 다시 반응 나에게 당신은 전자 때문에? " 괜찮아. 의는 그것을 여기에 또 하나의 응답을 드리겠습니다. 그것에게 좋은, 마일을 준다. 마일 : 좋은 하나? 예, 저를 도와주세요. 브라이언 SCASSELLATI : "예. 제발 도와주세요. ""확실해? " MILES : 아니요 브라이언 SCASSELLATI : 아니오. "그건 당신에게 무엇을 제안 하는가?" 마일 : 나는 전자되지 않을 수 있습니다. 브라이언 SCASSELLATI : "나는 전자되지 않을 수 있습니다. " "당신은 부정 할 어떤 말을하고 있습니까?" 괜찮아. 그래서 마일은 당신에게 너무 감사합니다. MILES : 감사합니다. 브라이언 SCASSELLATI : 대단히 감사합니다. [박수 갈채] 그래서이 ELIZA 프로그램, 여러 가지면에서, 조각에 바로 응답 우리는 어떤 깊은없이 제공하고 있는지 여기에 무슨 일이 일어나고 있는지 이해. 이것은 시스템의 일종 라는 패턴 매칭, 우리는 특정 찾고 우리는 다음있어 텍스트의 비트 밖으로 걸릴 것 무엇 입력으로 제공하고, 어떤 방법으로, 잠재적으로, 변환, 다음 다시 사용자에게 제공합니다. 당신의 생각하십니까 엘리자 실제로 그 여기에 올바른 정신 분석을 수행? 한 사람, 아마. 청중 : [들림]. 브라이언 SCASSELLATI : 어떻게 즉, 당신이 기분이 무엇입니까? 예, 사실, 않는다. 그리고 우리는, 실제로 보게 될 것입니다 단지 순간에 그것을위한 소스 코드. 그래서 당신은 할거야 정확히이 일을 할 수. 지금, 엘리자의 한 형태 인 무슨 우리는 오늘 채팅 봇 부를 것이다. 그냥 통과 당신이 제공하는 텍스트, 최소한의 금액을 제공합니다 이해 또는 처리, 다음에 다시 앵무새. 그럼 살펴 보자, 개념적으로, 그리고 이야기 무엇 그것은 엘리자가 실제로하고있는 것입니다. 엘리자는 복용 sentence--하자 "나는 내 상사에게 좋은 인상을하고 싶다."라고 그리고 엘리자는보고있다 그 문장을 통해 그리고 찾기 위해 노력하고 특정 패턴을 일치합니다. 따라서, 패턴의 예를 들어, 일 엘리자가 찾고있는 단어입니다 "내가 원하는." 그리고 어떤 시간은 뭔가를보고 즉, 그것에서 "내가 원하는"이 그것은 응답을 공식화한다. 그리고 그 응답은 고정 된 문자열입니다. 이 경우, "왜 당신이 원하는 무엇입니까?"이다 그리고 난에 작은 별을 넣어 결국 그건 그냥 때문에 우리의 응답의 시작입니다. 그리고 별이 있음을 나타냅니다 우리는 휴식을 취할거야 사용자의 utterance--의 "내 상사를 감동"- 그리고 우리는 그것을 추가 할거야 이 캐릭터 라인의 끝에. 그래서 지금보다는는 "왜, 말 당신은 내 상사 인상을 하시겠습니까? " 추가의 조금이있다 우리가 할 수 있습니다 처리. 즉, 우리는 할 것입니다 대명사의 일부를 변환 여기에 "내 상사"에서 "당신의 상사." 그리고 다른 몇 가지가있을 수 있습니다 우리가 만들 필요가 변경됩니다. 그래서 차라리 그냥 고집보다 직접 끝에, 우리는 무엇을 할 거 야 우리의 휴식을 취할 것입니다 흰색 here--에서 사용자의 utterance-- 우리는 한 조각에 그것을 할게요 시간과 각각의 문자열을 변환 토큰, 문장의 각 단어에,. 그래서 우리는 "을."말을합니다 변환이 없습니다 우리는 그것을 할 필요가있다. "날인." 변환이 없습니다 우리가 수행해야합니다. "내"변환됩니다에 "당신." 그리고 "상사"우리는 단지로 떠날거야 "보스." 그리고 마지막으로, 아무것도 그 기간 종료 우리는 문제로 변환합니다. 이것은 매우 간단한 패턴 매칭 사실은 꽤 성공적이다. 그리고이 도입되었을 때 1966-- 조셉 바이 첸 바움의 컴퓨터에이 프로그램. 그 때 지금, 컴퓨터 데스크탑 모델 아니었다. 그들은 자원을 공유했다. 그리고 그의 학생들은 것 가서 엘리자와 채팅. 결국, 그는에 있었다 이는 액세스를 제한 그의 학생들은되지 않았기 때문에 수행 어떤 일을 점점. 그들은 단지 엘리자와 채팅을했다. 그리고, 사실, 그는에 있었다 그의 조수를 해고하는 사람들 그녀의 모든 시간 엘리자 얘기를 보냈다 그녀의 깊은 우려되는 문제에 대한. 모든 사람이 시스템을 사용하는 사람들 를 의인화하기 시작했다. 그들은로 생각하기 시작 인 애니메이션과 실제 사람. 그들 중 일부를 인식하기 시작했다 그들이 말하는되었다는 것 다시 그들에게오고 있었다. 그리고 그들은 찾는했다 자신에 대한 것들. 그리고, 사실, 심지어 전문가 심지어 심리 치료사, 사실, 그 걱정하기 시작, 어쩌면 엘리자 그들을 대체 할 것이다. 심지어 컴퓨터 과학자들은 우리가 있었던 걱정 자연 언어를 해결하기에 너무 가까이. 이제, 그 사실에 어디 가까이하지 않았다. 하지만 그 방법 인상적이다 이 시스템은 보일 수있다. 그럼보고 시작하자 아래에 시도 질문의 약간을 얻을 수 이 코드가 실제로 발생하는 경우의. 그래서 우리는이 코드를 만들거야 나중에 사용할 수 있습니다. 그리고 이것은 매우이다 간단하고 직접적인 포트 원래 ELIZA 구현. 그래서 이러한 문체의 일부 당신이 여기에서 볼 수 있습니다 일 하지 문체 무엇이다 우리는 당신이 원하는 것 또는 우리는 당신이 할 가르치고했는지. 그러나 우리는 그들을 유지하기 위해 노력했습니다 많은 포트에서 동일 이 있도록했다 그것이 원래의 맛을 가지고있다. 그래서 우리는 포함하는거야 사물의 무리, 그리고, 우리는있을 것이다 키워드 것들의 집합 엘리자는 인식 할 수 직접 반응한다. 당신은 같은 단어가 있다면 "당신은 할 수 있습니다"또는 "아니오" "나는하지 않습니다"또는 또는 "예"또는 "꿈" 또는 "안녕하세요"다음 엘리자 이들에 선택적으로 반응 할 것이다. 우리는 또한이있을 것이다 일의 일정 수의 우리는 같은 스왑 것 변환 "내"가 "당신." 그리고 우리는 응답의 집합을해야합니다 이러한 각 키워드에 대한 그, 우리는을 통해 회전합니다 서로 다른 반응. 그래서 만약 내가 "예"라고 세 번 연속, 나는 세 가지 다른 얻을 수 있습니다 엘리자의 응답. 우리의 코드는 다음입니다 실제로 현저하게 간단한. 나는이 모든 과거를 아래로 스크롤하면 우리가 프로그래밍 한 응답 우리는 우리의 주요에 내려, 우리는 초기화하는거야 다른 변수의 커플 하우스 키핑 약간을 처음에는. 그러나 절대적으로 세트있다 당신이 이해할 수있는 코드. 난 말한다 하나의 큰 while 루프 반복해서이 반복 것. 나는 줄을 읽어 줄 테니, 나는거야 입력 문자열이 저장합니다. 그것은 만약 내가 확인하고 볼 수 있습니다 특별한 키워드 "안녕"하는 프로그램을 종료 의미한다. 그리고 내가 확인 여부를 볼 수 있습니다 누군가는 자신을 반복한다 반복해서. 그들이 만약 내가 그들에게 소리 것이다. 나는 "자신을 반복하지 않는다."라고합니다 언제 까지나 그 중 어느 것도 발생하지, 우리는거야 다음을 통해 루프를 통해 스캔, (308) (313)에 라인에 여기에, 체크 볼 이들 키워드는 임의 입력에 포함 된 문구 난 그냥 주어진 것이? 일치하는 그들을 위해 존재하는 경우, 잘 그 다음, 그 위치를 기억합니다. 그 키워드를 기억할 것. 그리고 응답을 구축 할 수 있습니다. 내가 하나 찾을 수없는 경우, 그럼, 키워드 배열의 마지막 내 기본 응답 할 것이다, 때 아무것도 다른 사람과 일치하지 않습니다. 내가 같은 질문을합니다 "왜 않았다 내가 당신을 도울 수 있는가? 이리와 "또는"? " 그 단지 부분적으로 적합 아무리 입력이 무엇인지. 우리는 엘리자의 응답을 구축합니다. 우리가 걸릴 수 있습니다 그 기본 응답, 우리는 점에서했던 것처럼 "내 상사"예. 그는이 모든 있다면 그것은 단지 하나의 경우 is-- 내가 respond--로되어있어 문자열 난 그냥 그것을 다시 보낼 수 있습니다. 이것은 별표에있는 경우 그것의 끝, 그때 나는거야 각 개별 토큰을 처리 사용자의 응답의 나머지 과 스와핑, 사람들을 추가 단어에 대한 단어는 내가 필요로. 이 모든 것은 절대적 당신이 만들 수 뭔가. 그리고 사실, 방법으로하는 우리 처리 명령 줄 인수를 당신이하는 방법 HTTP 요청을 통해 처리 규칙의 동일한 종류를 따릅니다. 그들은 패턴 매칭입니다. 그래서 ELIZA는 비교적 중요했다 자연 언어에 미치​​는 영향 그것은 것 만들었 기 때문에 그것은이었다처럼 아주 달성 목표, 어떻게 든처럼 우리는 거라고 직접적으로이 문제를 해결할 수. 이제, 그 엘리자가하는 것은 아니다 우리가하고 싶은 것 다. 확실히. 그러나 우리는 할 수 있어야한다 더 많은 일을 할 수 있습니다. 우리의 첫 번째 단계는 이동 엘리자는 것입니다 넘어 보고 할 수 있도록 입력되는 텍스트하지 키보드 그러나 연설로, 실제 음성 마이크에 기록했다. 우리가이보고 그래서 다른 조각, 우리는있어 모델 세트를 구축해야 할 것. 우리는 할 수있을거야 낮은 수준의 음향에서 이동 information-- 피치, 진폭, frequency-- 과에 그 변환 우리가있어 일부 단위 보다 쉽게​​ 조작 할 그리고, 마지막으로 조작 단어와 문장으로. 대부분의 음성 인식 그래서 거기에 오늘 시스템 통계를 따르십시오 우리가 구축하는 모델 무엇 별도의 세 가지 표현 그 오디오 신​​호가 실제로 포함되어 있습니다. 우리는 음성 모델로 시작 그건 그냥 기본에 대해 이야기 내가 생산하고있어 것을 소리가 난다. 나는 무언가를 생산하는 건가요 소년에서와 같이 B 또는 개에서와 같이 D? 나는 그 두 가지 인식 어떻게 분리 된 별개로 전화? 그 꼭대기에, 우리는 만들 수 있습니다 단어 발음 모델, 함께 연결 뭔가 그 개인 전화 그리고 단어로 결합합니다. 그리고 그 후, 우리는 말 할게요 우리는 언어를 조립합니다 완전한 문장으로 모델입니다. 이제, 우리는 서로에 대해 이야기하는거야 이 독립적으로 별도의. 그러나이 세 모델은 모두 다만 통계가 될 것. 그리고 그 때를 의미한다 그들과 함께 작업, 우리는거야 작업 할 수 그들 모두 동시에. 괜찮아. 이제 우리의 음성 모델을 시작하자. 그래서 음성 모델에 의존 계산 방법 숨겨진 마르코프 모델이라고합니다. 이러한 그래픽 모델하는 나는 이 세계의 상태를 인식 특징으로 같은 기능 세트로. 그리고 그 상태는 한 부분에 대해 설명 나는에 종사하고있어 액션의. 내가 만드는 생각한다면 어머니 같은 소리 "엄마", 다른있다 그 소리에 구성 요소. 나는 숨을 그리는 부분이있다. 그리고 나는 내 입술을 지갑. 그리고 내 입술은 다시 작은 롤 비트는 "엄마"소리를 확인합니다. 그리고 자료가있다. 내 입술이 떨어져 온다. 공기가 배출됩니다. "엄마." 그 세 가지 부분이 될 것이다 이 graph--의 상태로 표시 시작, 중간, 끝에. 그리고 전환을했을 것이라고 내가 한 상태에서 여행 할 수 특정 확률로 다음에. 따라서, 예를 들어, 그 M 아주가있을 수 있습니다 소리, beginning--에서 매우 짧은 섭취 다음과 이상 - "MM" 내가 잡고있어 진동 단계 내 함께 거의 humming-- 입술 "MMMM"- 후 매우 짧은 내가 breath-- 추방 곳 파열음 "엄마." 숨겨진 마르코프 모델입니다 사실을 캡처하도록 설계 그 내가 만드는 방법 그 소리 "엄마"는 것입니다 에 다소 차이가있을 수 있습니다 그 타이밍은, 주파수 그 기능을보다 당신이 그것을 만드는 방법 또는 방법은 내가 수도 내가 말하고있을 때 그것을 만들 편지에 ​​대한 다른 용도. "어머니"와 "할 수있다 나는"것 약간 다르게 소리. 그렇게 인식 할 특히 소리, 우리는 것 마르코프 모델, 이러한 숨겨진 마르코프를 구축 모델, 가능한 모든 전화의 나는 그 인식 할 수 있습니다, 가능한 모든 사운드, 다음에 봐 내가 가지고있는 음향 데이터 통계적으로 결정 어느 쪽이 가능성이 가장 높은 하나입니다 이 소리를 생산합니다. 그래. 그 모델로, 우리 다음 그 위에 구축하기 시작합니다. 우리는 발음 모델을. 이제, 때로는 발음 모델은 간단하고 쉽게 단 하나의 존재 때문에 방법은 무엇인가 발음한다. 다른 시간, 그들이있어 조금 더 복잡합니다. 여기 발음 가이드입니다 입니다 빨간 일에 대한 당신이 밖으로 케첩을 과일. 사람들은이 과일 생각하지 않습니다. 권리? 이제, 여러 가지 방법이 있습니다 사람들은이 단어를 발음하는 것입니다. 일부는 "발가락 - 월 - 발가락을."말할 것이다 일부는 "발가락-MAH 발가락을."말할 것이다 그리고 우리는 함께 그를 캡처 할 수 있습니다 이러한 그래픽 모델의 하나로 여기서, 다시, 우리는 전환을 나타냅니다 특정 확률을 갖는 것으로 그들과 함께 가능성을 관련. 내가 있다면이 경우, 따르도록 이 전체 그래프를 통해 상위 경로, 나는 편지에서 시작된다 이 맨 왼쪽에, "타"소리. 나는 위쪽 절반을 것이다, "오,"다음 "엄마" 다음 ","후 "TA"및 "오." "발가락 월 발가락." 나는 통해 아래 경로를했다 경우 이, 나는 "TA-MAH 발가락을."얻을 것이다 그리고 아래 다음 가면 내가 얻을 것, 최대 "TA-월 - 발가락을." 이러한 모델은 이러한 캡처 차이점 때마다 때문에 우리는 이들 중 하나 배포 인식 시스템, 그것은 작동 할 것 사람들이 다른 종류의 많은, 다른 악센트를 많이, 심지어 같은 단어를 다른 용도. 마지막으로, 그 꼭대기에, 우리는 무엇인가를 만들 수 있습니다 즉, 정말 복잡한 보인다 언어 모델이라고 그러나 사실의 간단 세이 작동하기 때문에 N 그램 모델이라고 무엇에. 그리고이 경우에, 나는 당신을 보여주는거야 두 부분의 N-g 모델 음절. 우리는 물리적 인 생각을하는거야 때로는, 특정 단어는 를 수행 할 가능성 다른 사람보다 단어를 주어진. 내가 방금 말한 경우 "일기 예보" 다음 단어 가능성 "오늘"이 될 수 또는 "날씨가 될 수 내일을 전망이다. " 그러나 "할 확률이 낮다 날씨는 아티 초크 전망이다. " 어떤 언어 모델이하는 것은 이 통계적으로 사람들을 캡처 매우 큰에서, 계산에 의해 신체의 모든 인스턴스 하는 한 단어가 다른 다음과 같습니다. 그래서 큰 corpus--을 경우 모든 월스트리트 저널 등 즉 1930 년 이후 생산 된 이는 표준 corpuses-- 중 하나입니다 나는 모든 통해보고 텍스트, 내가 계산 몇 번까지 후 "예상", "오늘"내가 볼 수행 얼마나 많은 시간을 내가보고 할 이어 "예상", "아티 초크" 첫 번째는 것입니다 훨씬 더 가능성이있을 수 있습니다. 그것은 나타날 것 훨씬 더 자주. 그리고 그것은 더있을 것이다 확률은 연관된. 나는를 파악하려면 전체 발언의 가능성, 다음, 나는 그냥 헤어. 청각의 확률 그래서 문장은 "쥐가 치즈를 먹었다" 단어의 확률을 나타낸다 ""문장을 시작, 다음 확률이 단어 "쥐"라는 단어 다음에 "," 그리고 확률이 단어 "쥐"다음 "을 먹었다" 그리고 확률이 "치즈"다음 "먹었다." 이것은 많은처럼 들린다 통계, 확률의 많은. 그리고는 것을 모두이다. 이 작업을 수행한다면 놀라운 일이다 데이터의 충분한 샘플, 그것을 작동합니다. 그리고 그것은 굉장히 잘 작동합니다. 우리 모두는 이러한 기술을 알고있다. 대부분의 운영 체제와 함께 이 시점에서, 음성 인식. 우리는 시리와 Cortana 및 에코를 사용합니다. 그리고이 일을 기반으로 세 계층이 유형의 model-- 바닥에서 음성 모델 중간에 발음 모델, 그 중 상단에 언어 모델. 이제 그들은 조금 더 할 필요가 질문에 대답하기 위해보다. 하지만 당신이있어 무엇의 인식 말은 정확히 따라 달라집니다. 그래서 여기에 예를 보자. 그래서 난 내 휴대 전화가 여기에 앉아있다 문서 카메라 아래에. 그리고 우리는 묻습니다거야 몇 가지 질문에 시리. 괜찮아? 그래서 여기 내 전화를 깨울 수 있습니다. 시리는 날씨 무엇인가 오늘 뉴 헤이븐처럼? SIRI : 여기의 날씨입니다 뉴 헤이븐, 코네티컷 오늘. 브라이언 SCASSELLATI : OK. 그래서 먼저는 시리가 인식 것을보고 개별 단어의 각 다음 반응을 일으켰다. 우리는 어떻게 반응에 대해 이야기 할 것입니다 조금에 대해 제공됩니다. 하지만 지금 우리가 알고있는 이 단지 기준입니다 원시 통계 및이에 접근 방식의 패턴 매칭 형, 우리는 시리와 어떤 게임을 재생할 수 있습니다. 그래서 나는 다시 시도 할 수 있습니다. 시리는 날씨 무엇인가 하마 뉴 헤이븐, 오늘? SIRI : OK. 여기에 새의 날씨입니다 헤이븐, 오늘 코네티컷. 브라이언 SCASSELLATI : 시리의 그게 daunted하지 그것은 pattern--을 발견 있기 때문에 "날씨", "오늘", "뉴 헤이븐." 즉, 응답 무슨이다 에, 단지 엘리자를 좋아한다. 괜찮아. 현실을 한 번 더 심지어 보겠습니다 더 말도 안되는 예. 시리, 날씨 아티 초크 딜 하마 뉴 헤이븐? SIRI : 나 그 확인하자. 여기에 내가 웹에서 발견 무엇 양인데 아르마딜로 무엇인가 하마 뉴 헤이븐. 브라이언 SCASSELLATI : OK. 그래서 나는 충분히 멀리 가면 멀리이 모델에서, 나는 그것 때문에 혼동 할 수있어 없음 이상이있는 패턴과 일치. 그리고 그 통계를 말의 엔진, 당신이있어 가능성은 무엇인가 단어 하마와 아티 초크 함께, 그리고 딜? 즉 새로운 뭔가있을거야. 이러한 기술 그래서 우리는 매일 사용합니다. 우리는 그들에게 한 단계를 수행하려면 또한,하지만, 우리의 경우 실제로 그것은 무엇에 대해 이야기 할 수있게하려면 이러한 시스템에 반응하고 있다는 것입니다, 우리는에 대해 다시 얘기해야 질문의 더 근본적인 세트. 그리고 그 소통하는 항목의 우리는 질문에 응답 전화있다. 그것은 우리가 그래 이러시면 할 수 있도록하려면, 무엇입니까? 청중 : [들림]. 브라이언 SCASSELLATI : 우리가받을 수 있나요 잠재 의미 처리에? 그래서 그래. 것들을 많이 있습니다 시리와 표면 아래 일어나고 및 예제의 일부에 나는 다음을 보여거야 여기서 꽤있다 구조면에서 당신이 무슨 말을하는지의 중요합니다. 그리고, 사실, 그 좋은있어 나를 위해 다음 슬라이드 전구체. 같은 방법으로 그래서 우리를 음성 인식이 구축되었다 여러 층으로, 우리가 원하는 경우 그것은 그 사실의 무엇인지 이해 말했다되고, 우리는 다시거야 다층 분석에 의존 인식되고있는 텍스트의 색입니다. 그래서 시리 실제로 할 수있는 경우 말하자면, 나는이 말을 발견 본다. 지금은 그들과 함께 무엇을해야합니까? 첫 번째 구성 요소로 자주 통과하고 분석하려고 문장의 구조. 그리고 무엇을 우리는 보았다 초등학교에서, 자주, 다이어그램의 종류 등 문장, 우리는거야 확신을 인식 단어는 어떤 역할을해야합니다. 이들은 명사입니다. 이들은 대명사입니다. 이러한 동사입니다. 그리고 우리는 인식 할거야 특정 문법에 대한 그, 이 경우 영어 문법에있다 내가 그들을 결합 할 수있는 유효한 방법 및 유효하지 않은 다른 방법. 즉, 인식, 그 구조, 우리를 안내하기위한 충분한 수 있습니다 조금. 그러나 그것은 아주 충분하지 않습니다 우리가 줄 수 있으려면 여기 말했다되고 있는지에 대한 의미. 이를 위해, 우리는 의존해야 할 것이다 의미 적 처리의 일부 금액. 즉, 우리가보고해야 할거야입니다 에서이 단어가 어떤 각 아래에 실제로 의미로 전달한다. 그리고이 일을 가장 간단한 방법으로, 우리는 각각의 단어와 연관거야 우리가 어떤 기능을 알고, 특정 변환 그것은 그 일어날 수 있습니다. 이 경우, 우리는 라벨 수도 적당한 이름 인 것으로 단어 "존", 것을 그것은 정체성 함께 수행한다. 그리고 우리는 레이블 수 같은 방법으로 "마리아". "사랑,"와 같은 동사 반면에 그 특정 관계를 구성한다 우리는 표현할 수있어있다. 이제, 그 의미하지 않는다 우리가 이해할 수 사랑이 무엇인지 우리가 이해하는 것만 있지만 그것은 상징적 인 시스템의 방법으로. 그것은 우리가 레이블을 지정할 수있다 그것과 조작. 이러한 유형의 접근법들 각각과, 시맨틱 처리 임의의 유형 여기에 조금을 필요로하는 것입니다 지식의 비트와 많은 작업 우리의 부분에. 우리는 영역에서 더 이상 것 없다 여기서 그냥 일반 통계 우리에게 충분 것입니다. 이제 순서대로하면 이동합니다 되는이 시점에서 의 내부에 대해 이야기 할 수 무엇 실제로, 여기에 무슨 일이 일어나고 이 조작 할 수있는 것 구조와 질문을 이해 다음 수있는 나가서 검색하려면, 그 이상을 요구한다 복잡한인지 모델. 이러한 시스템이 구축되는 방법 대부분의 경우 매우 노동입니다 강한. 그들은 인간을 포함 큰 거래를 지출 시간의 방법을 구조화 이는 이런 종류의 문장 어떤 논리로 표현 될 수있다. 그것은 조금이라도 얻는다 더 복잡하지만. 심지어 우리가 처리 한 후에 의미, 우리는거야 여전히 봐야 말했다되고 있는지의 화용론. 그게 내가 말을 관계 어떻게입니다 나는 물리적으로 뭔가를 가지고 이 세계에서 또는 적어도 일부 정보원 있음을 나는 조작 할 수 있습니까? 때때로, 이러한 이어질 모호함의 멋진 비트. "레드 핫 별은 천문학 자와 결혼합니다." 그래. 이제, 우리는 같은 것을 읽기 제목의 재미 유형 우리는 늦은 밤 TV에서 보는 것 우리는 "스타"를 해석하지 않기 때문에 천체의 의미를 가지고있다. 우리는 더 의미 알고 평범한 배우 또는 여배우 가시성 높은 양의. "분대 개 물린 피해자를하는 데 도움이됩니다." 이 팀은 실제로인가요 거기 개를 지원 주위에 가서 피해자를 물어 뜯고에서? 또는이 있었다는 것을 그것을이다 이었다 개별 도움이 필요한 개에 물린? 그냥 구문보고에서 그리고 문장의 의미, 우리는 그것을 확인할 수 없습니다. "헬리콥터 인간의 파리에 의해 구동." 사실, 실제이 있습니다 그 주위를 비행하는 작은 것들 날개 전원을 가진 사람들은 인류의 이익을 위해 헬기? 아니면 하나의 기계 장치가있다 그 사람에서 전원을 유도? 우리는 질문을 볼 때 응답 시스템, 이들은 층됩니다 우리는 처리 할 필요가있다. 이제, 최고의 가장 종류 이러한 시스템의 보급 오늘은 할 수 있습니다 있는 수준의 것들 지금까지 무엇을 넘어 우리는 10 년 전했다. 여기에 최고의 시스템 중 하나입니다 즉, 거기 오늘. 그리고 이것은 시스템 IBM의 왓슨을했다. 이는 IBM에서 우리의 친구에서입니다. 이것은, 지아 첸 캐서린 은행입니다 그리고 프리실라 Moraes는 우리를주는 왓슨의 데모 IBM 요크 타운에서 어제. [비디오 재생] 당신은 - 어떻게입니까? - 난 잘입니다. 나는 내가 할 때 항상 행복하다 특히 때, 생각 이 서버 실에서 멋진 머물 수 있습니다. 좋아하는 여배우는 누구입니까? - 내 마음에 드는 여배우 라라 크로프트와 같은 안젤리나 졸리 툼 레이더에서 그녀의 원래 때문에 형태 나 같은 가상 문자로했다. - 어떻게 왓슨은 환자를 도울 수 있는가? 에 환자에 대한 계획을 거니 직접 왓슨에 액세스 할 수 있습니다? 왓슨의 자문에 대한 액세스 응용 프로그램은 사용 사례에 따라 다를 것입니다. 그러나 현재 왓슨은 제공 할 것입니다 가능한 진단 및 치료 의료 전문가에 대한 옵션을 제공합니다. 적절한 경우, 환자 정보를 제공 할 수있다 왓슨에, 아마도 통해 포털 웹 인터페이스, 태블릿, 심지어 휴대 전화. 예를 들어, 환자가 될 수있다 자신의 증상을 설명하도록 요청 자연 언어에서 직접 왓슨 솔루션으로, 의사에 집중할 수 있도록 진단이 아닌 데이터 수집. 누구 에이브 러햄 링컨 암살? 존 윌크스 부스. -in 무엇 올해는 애리조나를했다 다이아몬드는 월드 시리즈 우승? -2001. [END 재생] 브라이언 SCASSELLATI : 그래서 이러한 종류의 시스템 우선에 의존해야 음성을 인식하는 단계; 초, 의미 내부로 변환 대표; 다음, 제 3 수있는 것은 나가서 찾을 수 정보원 그 그들에게 그 질문에 대답 할 수 있습니다. 이러한 복잡성은 포함 프로그램 사물의 같은 종류의 당신이되었는지 문제 세트에서하고. 우리는에 HTTP 요청을 구문 분석 할 수있어 낮은 수준의 패턴의 동일한 유형 엘리자가 할 수 일치. 우리는 사람들을 변환 할 수있어 내부 표현으로, 다음 몇 가지를 조회하는 데 사용할 외부 데이터베이스는 SQL을 사용 가능. 시스템의 모든 것을 현재 건설되고 자연의이 유형을 할 수 언어 통신 기반으로 구축되고있다 이 같은 원리. 추천 지금까지도 시스템 왓슨 충분히 복잡하지 임의의 답변을 할 수 있도록 어떤 주제에 대한 질문. 사실 그들은해야 주어진 도메인 내에서 구조. 그래서 당신은 온라인으로 갈 수 있으며, 당신은 찾을 수 있습니다 잘 작동 왓슨의 버전 의료 정보학 내. 또는 하나의 온라인있다 그 얼마나 다루고 에 대한 좋은 권고를 만들기 위해 어떤 음식을 어떻게 맥주를 이동합니다. 그리고 그 영역 내에서, 이 질문에 대답 할 수 있습니다, 이 필요한 정보를 찾을 수 있습니다. 하지만 당신은 혼합하고 일치하지 않을 수 있습니다. 훈련있어 시스템 음식과 맥주의 데이터베이스 때 갑자기 잘 작동하지 않습니다 의료 정보학에 그것을 넣어 데이터 베이스. 그래서 심지어 우리의 가장 좋은 시스템 오늘 처리 수준에 의존 이는 우리가 손 코딩하고 인프라를 위해 구축 이 시스템 실행을 확인합니다. 이제 마지막 주제는 내가 원하는 오늘에 도착 할 수 있도록 비언어적 의사 소통에 관한 것입니다. 정보의 큰 덩어리가 우리는 서로 통신 를 통해 약 오지 않는다 우리가 적용하고 개별 단어. 그것은 같은 것들과 관련이있다 근접, 시선, 목소리의 톤, 당신의 활용. 그리고 통신도 뭔가 많은 서로 다른 인터페이스 에 대해 많은 관심. 이 시리에 대해 관심 게 아니에요. 나는 한 목소리로 시리 뭔가를 요청할 수 있습니다 또는 음성의 다른 톤, 그리고 시리는 것 나에게 같은 대답을 제공합니다. 그러나 그것은 우리가 만들 게 아니에요 인터페이스의 많은 다른 종류. 난 당신을 소개 할 현재의 로봇 중 하나. 이것은 나의 오랜에 의해 만들어진 친구 및 동료 신시아 Breazeal와 그녀의 회사 Jibo. 그리고이 ro​​bot-- 우리는거야 몇 자원 봉사자을 가지고 이 상호 작용하기 마련. 그래서 두 사람이 기꺼이을 가질 수있다 나를 위해 로봇 재생? 당신은 왜 최대에 오지 않는다 하지 왜 당신은 최대 어서. 당신이 나를에 가입하려는 경우, 제발. 그리고 당신이 할 수 있다면 바로 여기 온다. 감사. 안녕. 알프레도 : 만나서 반가워요. 알프레도. 브라이언 SCASSELLATI : 알프레도. 레이첼 : 레이첼. 브라이언 SCASSELLATI : 레이첼. 모두 만나서 반갑습니다. 알프레도, 당신이 먼저가있을거야. 여기에 바로 가자. 내가 소개하려고 해요 얘들 아 나​​는이를 얻을 수 있다면 microphone-- 노크없이 Jibo라는 작은 로봇에. 그래? 이제 Jibo은 상호 작용하도록 설계되었습니다. 그리고 그것은 당신이 연설을 할 수 있지만, 로봇과의 상호 작용의 대부분 비언어적이다. 알프레도, 난 당신을 물어 갈거야 뭔가 좋은 무료 말 로봇주세요. 알프레도 : 당신이 귀엽다 생각합니다. [기계음 소리] 브라이언 SCASSELLATI : OK. 그 응답은 언어 적 없습니다. 그럼에도 불구하고 그것은 당신에게 준 모두 명확한 확인 이 들었던 것을 당신이 말한 또한 어떻게 든 그것을 이해했다. 그래? 바로 다시 여기에 초 단계. 고맙습니다. 레이첼, 당신이한다면. 지금, 나는 줄거야 당신이 훨씬 더 열심히 작업. 당신이 바로 여기 서하려는 경우, 백업 조금 그래서 우리는 카메라에 당신을 얻을 수 있습니다 이 방법을 찾습니다. 내가 뭔가를 말하도록 요청하는거야 정말 의미와 로봇에 불쾌한. 레이첼 : 방금 보였던 것 어떻게 완전히 터무니했다. [허밍 소리] 즉 더욱 터무니했다. 너 무슨 일있어? 아, 나쁜 생각하지 않습니다. 나는 당신에게 포옹을 줄 것이다. 브라이언 SCASSELLATI : 좋아. 감사합니다, 레이첼. 알프레도, 레이첼, 고마워 정말. [박수 갈채] 그래서 상호 작용의 종류에있다 여러 가지 방법으로 동일한 규칙의 일부 와 같은 일부 내용과 구조 우리 언어 적 상호 작용이있을 수 있습니다. 그것은 모두 의사 소통과 중요한 용도로 사용됩니다. 그리고 그 상호 작용에 많은 방법이, 설계 에 특히 효과가 사람과 상호 작용 또는 청취 로봇. 지금, 나는 충분히 운이 좋은거야 오늘 Jibo을합니다. 샘 스폴딩은 여기 도와 로봇과 우리 밖으로. 그리고 나는 줄 샘을 물어 갈거야 Jibo 춤의 우리 하나 좋은 데모 우리는 여기서 끝에서 볼 수있다. 따라서, 앞서 Jibo로 이동합니다. SAM : OK, Jibo. 우리에게 당신의 춤 동작을 보여줍니다. [음악 재생] 브라이언 SCASSELLATI : 좋아, 모두. Jibo에서 우리의 친구에게 감사합니다. [박수 갈채] 우리의 친구 덕분에 IBM 오늘을 돕는. 통신은 뭔가 당신은 거라고 오고 점점 더 볼 수 있습니다 우리는 더 복잡한 인터페이스를 구축 할 수 있습니다. 다음 주, 우리는 이야기 할 것이다 인터페이스하는 방법에 대한 게임에서 컴퓨터 상대와. 하지만 당신은이에 대한 질문이있는 경우, 나는 근무 시간에 주위에 오늘 밤에있을 것입니다. 나는 AI에 대해 얘기 행복 해요 주제 또는 더 자세히 얻을 수 있습니다. 좋은 주말 보내세요. [박수 갈채] [음악 재생]