Theo một nghiên cứu gần đây của NPR / Edison Research về những người sở hữu loa thông minh, 42% người được khảo sát nói rằng nó trở nên thiết yếu đối với cuộc sống hàng ngày của họ, 47% nói rằng họ sử dụng nó nhiều hơn so với khi họ mới sử dụng và 65% nói họ sẽ không trở lại cuộc sống mà không có họ. Và trong số tất cả những người tham gia cuộc khảo sát này, 76% sở hữu Amazon Echo.
Tương lai của giọng nói đầu tiên
Mặc dù tôi đã thực hiện khảo sát, bạn có thể đếm tôi trong tất cả các số này, kể từ khi tôi mua Amazon Echo đầu tiên của tôi gần ba năm trước, tôi đã bị mê hoặc bởi cách nó có thể làm rất nhiều điều chỉ bằng cách hỏi Alexa. Vì vậy, tôi đã rất hào hứng khi nói chuyện với Dave Isbitski, Nhà truyền giáo chính của Amazon cho Alexa và Echo, để nghe thêm về cách thức thiết bị xuất hiện, cách kết hợp Echo / Alexa ảnh hưởng đến hành vi và mong đợi của khách hàng, và nơi anh ấy nhìn thấy giọng nói đầu tiên công nghệ đưa chúng ta trong tương lai.
$config[code] not foundDưới đây là bảng điểm chỉnh sửa cuộc trò chuyện của chúng tôi. Để nghe toàn bộ cuộc phỏng vấn, nhấp vào trình phát được nhúng bên dưới.
* * * * *
Xu hướng kinh doanh nhỏ: Có lẽ bạn có thể cho chúng tôi biết một chút về cách Echo xuất hiện, bởi vì nó ra khỏi màu xanh đối với hầu hết mọi người.Dave Isbitski: Ý tưởng đằng sau nó luôn là một chiếc máy tính Star Trek. Và khả năng sử dụng giọng nói của bạn, để thực sự có một cuộc trò chuyện. Tôi nghĩ rằng đối với tôi và đối với nhiều người, khi bạn nhận ra bạn đang có một cuộc trò chuyện - và nó không phải là một công nghệ mà dịch giọng nói của bạn thành một loại văn bản nào đó và sau đó xử lý nó - đó là sự khác biệt. Bạn có thể nói một cách tự nhiên, tự nhiên.
Tôi nói chuyện với khách hàng và họ nói họ thậm chí còn nhớ cách họ làm việc. Bạn chỉ cần đi lên và bạn làm điều đó, và đó là cách chúng ta có những cuộc trò chuyện với mọi người. Tôi không nhớ rằng tôi đã yêu cầu các con tôi đêm qua đi ngủ và đảm bảo rằng chúng đã sẵn sàng vào ngày hôm sau, tôi vừa mới làm, và đó là thay đổi quan trọng.
Thật vui khi bạn nhớ năm 2014, tôi cũng là thành viên Prime. Tôi đã nhìn thấy chúng, nhưng tôi thực sự có riêng cho đến tháng 2 năm 2015, bởi vì chúng tôi đã chuyển chúng ra cho khách hàng trước nhanh nhất có thể. Vì vậy, tôi sẽ nhìn thấy nó khi tôi ở văn phòng Seattle, nhưng tôi đã có một con trong nhà, và đối với tôi có một con trong nhà giống như chú chó của gia đình tôi là chuột lang.
Những đứa con của tôi khi chúng sử dụng thứ này và vợ tôi khi cô ấy sử dụng nó, nó giống như thế nào đối với một người mà không có dây trong não như tôi? Tôi nghĩ ở đâu, tất cả công nghệ, rất tuyệt, và tôi thích nó, và tôi muốn sử dụng tất cả những thứ mới, phải không? Vì vậy, đó thực sự là khởi đầu cho tôi, tôi đã không dạy bất cứ ai.
Và nhìn lại, tôi nghĩ đó là vì chúng tôi đã đạt đến điểm bùng phát này. Khoa học máy tính đằng sau nó, sử dụng các mạng lưới thần kinh sâu sắc và sự hiểu biết, ngữ âm của cách một từ Vọng Khi bạn đặt các từ lại với nhau trong câu, cơ hội thực sự mà một từ khác sẽ đi theo nó là gì? Điều đó thực sự làm thế nào máy móc đã thay đổi. Nếu tôi sẽ nói điều gì đó, và tôi có thể sử dụng các tính từ và những thứ khác. Có một xác suất cao rằng nó sẽ diễn ra, dựa trên bối cảnh của cuộc trò chuyện mà chúng tôi đã có, những từ đó sẽ thực sự là gì.
Trong quá khứ, mỗi từ chỉ là một từ được dịch, phải không? Nó giống như cách chúng ta hoạt động. Chúng tôi đang có cuộc trò chuyện này, nếu đột nhiên tôi bắt đầu nói về những câu nói vô nghĩa, chỉ cần nói với nhau một loạt các từ, bạn sẽ giống như, Who Whoa, Dave đã bỏ gì vào cà phê của mình? giác quan. Vì vậy, mà thay đổi biển. Bạn quay trở lại năm 2014, 2015. IoT (Internet of Things) là thứ. Và đối với tôi, khi tôi thực sự có một Echo, nó giống như, Oh Oh, đây là Internet của Things điều chữa lỗi. Nó không phải là một máy tính. Nó có một thiết bị mà kết nối với Internet và đó là một thiết bị làm việc, và sau đó Smart Home có ý nghĩa với tôi, đột nhiên. Tôi có thể yêu cầu đèn, tôi bắt đầu với bóng đèn và chuyển sang máy điều nhiệt, và mọi thứ khác.
Tôi nghĩ rằng, sự thay đổi cơ bản. Đó là mọi người bắt đầu có được nó, và bạn đã thấy điều này trong đó có một nhận thức chung về công chúng khi nó chuyển từ những người chỉ gọi nó, là Echo Echo, một sản phẩm, đến Alexa. Nó thực sự là một cái gì đó hoặc một người mà tôi có cuộc trò chuyện này.
$config[code] not foundNó thực sự gọn gàng để xem sự thay đổi theo thời gian. Có một cái gì đó mạnh mẽ Trong cuộc trò chuyện. Để chúng tôi có một cuộc trò chuyện thực sự tốt, bạn phải có được tôi. Bạn hiểu những gì tôi nói, và tôi hiểu bạn, và vì vậy, nó cá nhân. Nó có mối quan hệ và bạn không thể có được điều đó với bất kỳ loại công nghệ nào khác. Bạn có được điều đó với cuộc trò chuyện.
Xu hướng kinh doanh nhỏ: Mối quan hệ giữa Amazon và khách hàng của họ đã thay đổi như thế nào khi ngày càng nhiều khách hàng bắt đầu sử dụng Echos và kêu gọi Alexa thực hiện?
Dave Isbitski: Tôi không biết, nếu bạn muốn xác định sự thay đổi. Chúng tôi luôn làm việc từ khách hàng trước, và ngược lại, trong mọi việc chúng tôi làm. Bạn sẽ thấy đó là một nguyên tắc lãnh đạo, bạn sẽ thấy đó là một phần của văn hóa. Tôi nghĩ rằng những gì mà thực sự thay đổi là ở đó, không có gì mới mà một khách hàng không thể làm được thông qua trang web hoặc một ứng dụng di động, những gì mà Thay đổi là cách họ làm điều đó.
Tôi không biết rằng những thứ đến từ nhà tôi từ Amazon là vì vợ tôi vừa yêu cầu Alexa đặt hàng lại, cho đến khi tôi thấy nó xảy ra vào một ngày nào đó.
Tôi nghe cô ấy nói, Alex Alexa, đặt hàng lại mèo, anh và tôi giống như, Chờ đợi, bạn đang làm gì, bạn đã làm được bao lâu và cô ấy giống như, tôi đã làm điều đó mãi mãi. Sau đó, tất nhiên tôi bắt đầu nướng cô ấy, tôi thích, Làm sao bạn phát hiện ra điều này? Cô ấy giống như, tôi không biết, tôi chỉ hỏi cô ấy., Đây là một kỳ vọng của khách hàng mà trước đây không có. Đột nhiên, nếu Alexa biết tôi và tôi làm việc với Alexa, tôi sẽ chỉ hỏi và xem liệu cô ấy có làm được không.
Vì vậy, mối quan hệ đã thay đổi. Ban đầu, bạn phải biết về những kỹ năng Alexa này Các công ty và thương hiệu, hoặc người có sở thích, hoặc bất kỳ ai cũng có thể tạo ra một kỹ năng; và về cơ bản, bạn dạy Alexa về một cái gì đó, và làm thế nào để có một cuộc trò chuyện về nó. Vì vậy, đó có thể là đặt mua một chiếc bánh pizza Domino hay đặt hàng từ Uber, Lyft hoặc hỏi số dư ngân hàng của bạn từ Capital One. Hoặc nó có thể là một trò chơi mà bạn muốn chơi.
$config[code] not foundVà hôm nay, bạn có thể giống như, Alex Alexa, tôi muốn chơi Jeopardy, trực tiếp và sau đó cô ấy tìm ra cách kích hoạt nó cho bạn thay mặt bạn. Hoặc bạn có thể nói, Alex Alexa, làm thế nào để tôi nấu bánh quy sô cô la chip? Và sau đó cô ấy tìm ra tất cả các kỹ năng công thức khác nhau có thể làm điều đó là gì?
Tôi nói rằng, đó cũng là một sự thay đổi mà chúng tôi đã thấy với khách hàng. Nó giống như cách con người chúng ta có những cố vấn đáng tin cậy. Và bây giờ, có một kỳ vọng rằng bạn có thể nói chuyện với Alexa. Thật là điên rồ khi nghĩ, thậm chí chỉ trong 3 hoặc 4 năm, làm thế nào mà Lừa có thể thay đổi theo cách đó, phải không?
Xu hướng kinh doanh nhỏ: Vâng, vậy thì đâu là sự phát triển đáng ngạc nhiên nhất mà bạn đã thấy với Echo và khách hàng? Làm thế nào họ sử dụng nó hoặc làm thế nào họ không sử dụng nó? Điều gì là một thứ gì đó thực sự làm bạn ngạc nhiên về toàn bộ quá trình này?
Dave Isbitski: Có một vài cách khác nhau tôi có thể nghĩ về điều đó. Là một chuyên gia công nghệ, tôi chắc chắn có thể mơ ước lớn. Vì vậy, ban đầu tôi nhớ, khi chúng tôi cố gắng quyết định khi nào chúng tôi sẽ phát hành các SDK này (bộ công cụ phát triển phần mềm), vì vậy bộ kỹ năng Alexa để xây dựng các kỹ năng trong Alexa về cơ bản cho phép bạn đưa Alexa vào bất cứ điều gì, cho dù đó là phần cứng hoặc phần mềm. Tôi nhớ, chúng tôi muốn làm điều đó sớm hơn sau này, vì chúng tôi muốn được ngạc nhiên. Chúng tôi biết mọi người sẽ tinker và họ sẽ tạo ra mọi thứ.
Bạn cũng có một số thành kiến, nhìn lại tôi chắc chắn đã có thành kiến. Tôi không nghĩ thứ này có thể chơi những trò giải trí.
Đó chỉ là một thiên vị của Dave Dave, tôi muốn được ấn tượng. Và sau đó tôi thấy những thứ như EVE Online, tôi là một game thủ lớn. Nó có một MMO (trò chơi trực tuyến nhiều người chơi), nhưng nó có nền kinh tế riêng và bạn bay trên tàu vũ trụ của bạn, nó chỉ là vũ trụ rộng lớn này. Và sau đó ai đó đã tích hợp Alexa, vì vậy họ có một chiếc Echo và họ đang lái con tàu của họ theo nghĩa đen, họ đã làm mọi thứ như Thuyền trưởng Picard. Khi tôi nghĩ về chơi game, tôi thậm chí không nghĩ về điều đó, nhưng bây giờ họ có nghĩa đen là tôi muốn nói về sự đắm chìm, bạn đã thay đổi cách bạn tương tác với nó, bởi vì bây giờ bạn là có một cuộc trò chuyện với một trò chơi không bao giờ được tạo ra để thậm chí có thể có một cuộc trò chuyện.
Điều đó thật tuyệt vời. Sau đó, các yếu tố hình thức khác nhau trong phần cứng đã xuất hiện và chúng tôi đã khởi chạy Echo Dot. Một trong những điều đầu tiên họ nhìn thấy, là ai đó đã lấy Dot của họ, đặt chiếc cốc đựng cà phê vào giữa xe và sử dụng internet di động của họ, và họ đã đi vòng quanh với Alexa. Đây là Alexa trên một modem, phải, và tôi giống như, Wow Wow.
Và bây giờ tôi mang theo một Dấu chấm bên mình, nhưng tôi có thể thấy kịch bản tương tự cho một chiếc xe hơi. Khi có một bóng đèn phát sáng trong đầu bạn, nơi bạn không thể nghĩ về nó, thì đó là máy tính xung quanh. Bạn chỉ cần đặt câu hỏi với không khí và bạn mong đợi một câu trả lời. Thật thú vị, vì tôi cũng có rất nhiều bài thuyết trình và tôi sẽ chia sẻ điều này với bạn. Luôn luôn có chủ đề này trong tâm trí tôi, sau ba năm kể từ ngày này, rằng khi tôi lên sân khấu và tôi nói, thì Alex Alexa, Hồi mà tôi đã nghe thấy cô ấy. Nó thật kỳ lạ.
Các nhà phát triển tiếp tục làm tôi ngạc nhiên về tất cả các loại đó, và khía cạnh phần cứng và phần mềm của mọi thứ, vì vậy, Alex Alexa có mặt trên Mac thông qua những người đã triển khai phần mềm, cô ấy trên iPhone và Android, và sau đó cô ấy ở trong loa và tủ lạnh. Vì vậy, nói về việc mong đợi cô ấy trả lời cho dù bạn ở đâu, tôi nghĩ về một số lĩnh vực cô ấy sẽ làm, nhưng theo nghĩa đen, nó cũng làm tôi ngạc nhiên, tất cả những nơi mà bạn có thể có một cuộc trò chuyện bây giờ.
Xu hướng kinh doanh nhỏ: Bạn có cảm giác rằng khách hàng đang muốn loại thiết bị này hay bạn có cảm giác rằng, chỉ dựa trên những gì các bạn đang làm trong nội bộ, đây là thiết bị mà họ muốn cuối cùng?
$config[code] not foundDave Isbitski: Vì vậy, đó là rất nhiều về một thiết bị. Echo sử dụng Alexa và Echo là cách chúng tôi xây dựng phần cứng, nhưng đối với chúng tôi, đó thực sự là về giọng nói. Chúng tôi có một Quỹ Alexa, một quỹ 100 triệu đô la để thúc đẩy sự đổi mới trong tiếng nói. Chúng tôi tin rằng tiếng nói sẽ thay đổi căn bản cách chúng ta tương tác với công nghệ. Nếu bạn bắt đầu với khách hàng và bạn làm việc ngược lại, điều tốt nhất bạn có thể làm cho khách hàng, và điều này đúng trên trang web và trong các ứng dụng di động của chúng tôi, là làm cho nó dễ dàng và trực tiếp nhất có thể. Nhìn vào mua sắm 1-Click.
Xu hướng kinh doanh nhỏ: Một năm, hai năm, ba năm, thậm chí năm năm kể từ bây giờ, chúng ta sẽ ở đâu với giọng nói, và gần giống như thiết bị đầu tiên bằng giọng nói và tận dụng tiếng nói cho tất cả các loại tương tác? Bạn thấy chúng ta đang ở đâu trong khung thời gian đó?
Dave Isbitski: Trong vai trò của tôi, tôi luôn cố gắng đặt ống kính cho ai đó mà không bao giờ sử dụng cái này. Bởi vì tôi nghĩ rằng, cách tốt nhất để bạn dự đoán về tương lai như thế. Bởi vì cuối cùng, là một nhà công nghệ, tất cả chúng ta đều muốn tạo ra công cụ, và đôi khi chúng ta tạo ra nó chỉ vì chúng ta có thể. Nhưng tôi nghĩ rằng nơi bạn thực sự thấy công nghệ được đón nhận và tiến về phía trước, và sự thay đổi thực sự là khi nó trở thành một thứ quan trọng đối với mọi người, mà họ sử dụng trong cuộc sống của họ, và nó có một sự khác biệt cơ bản.
Và khi tôi nghĩ về giọng nói như vậy, tôi nghĩ về những lĩnh vực mà một người bình thường có thể yêu cầu là gì? Vì vậy, ô tô là siêu thú vị trong không gian đó. Khi tôi ở CES và tôi chỉ nhìn quanh Ford Ford có toàn bộ thiết lập, nơi bạn thực sự có thể nói chuyện với Alexa, và sau đó nhìn thấy tất cả những chiếc xe tự lái và tất cả những thứ đó. Điều đó, với tôi, nếu chúng tôi nhìn vào sự thay đổi từng ngày, để thấy rằng, khả năng có một cuộc trò chuyện với chiếc xe của bạn cho bất cứ điều gì bạn cần. Tôi sẽ trở thành một trong những người mà tôi nghĩ tôi sẽ thận trọng hơn một chút vì tôi thích lái xe, tôi đã làm điều đó cả đời.
Nhưng những đứa trẻ của tôi, tôi không nghĩ, sẽ nghĩ bất cứ điều gì về nó. Họ thậm chí còn chưa lái xe, và tại sao bố của anh ấy lại lái xe cho tôi, máy sẽ tốt hơn anh ấy. Vì vậy, có một cách nhìn khác về điều đó, vì vậy tôi nghĩ chúng ta sẽ bắt đầu thấy cái đó.
$config[code] not foundSự khác biệt thực sự là san lấp mặt bằng. Trình độ tuyệt vời của công nghệ. Mỗi công nghệ tôi đã từng sử dụng, tôi nhận được nhiều hơn từ tôi hơn tôi nghĩ rất nhiều người đã làm, bởi vì tôi là kỹ thuật, vì vậy tôi có thể tìm ra mọi thứ. Tôi có thể tha thứ. Tôi nghĩ rằng các nhà phát triển đã nghĩ như thế nào, vì vậy ngay cả khi điều gì đó không rõ ràng, tôi thích, tôi cá là bạn có thể làm như thế này.
Vậy mà bạn phải đào tạo người. Touch làm mọi thứ dễ dàng hơn, nhưng vẫn còn rào cản đó. Bây giờ bạn có thể có một cuộc trò chuyện, bạn không cần phải dạy. Bạn chỉ có thể yêu cầu AI làm điều gì đó và nó sẽ xảy ra. Vì vậy, nó rất khác nhau. Bạn nhìn ngành tài chính. Tôi sẽ cho bạn một ví dụ. Nợ và tín dụng, bảng cân đối và lãi suất, tại sao tôi cần biết về điều đó như một con người? Tôi đã nói chuyện với Capital One tại re: Invent năm ngoái và họ nói rằng một trong những yêu cầu hàng đầu của họ từ khách hàng là một câu, tôi đang làm thế nào?
Xu hướng kinh doanh nhỏ: Wow.
Dave Isbitski: Bây giờ, một thứ gì đó mà bạn sẽ làm với một ứng dụng di động, đó là một thứ rất con người, nhưng đó là một cuộc trò chuyện mà bạn thực sự có thể có ngày hôm nay, và tôi đang làm thế nào cho tôi nghĩa là, tôi có trả tiền thế chấp đúng hạn không? Những gì đã trải qua trên một số thẻ tín dụng? Những điều như thế. Nhưng nó có nghĩa là một cái gì đó khác nhau cho mọi người. Nhưng giao diện, mà con người rất có. Vì vậy, tôi nghĩ rằng chúng ta sẽ thấy nhiều hơn về điều đó, thay vì buộc mọi người chấp nhận ngôn ngữ của các ngành cụ thể và học công nghệ để tương tác với điều đó, chúng ta có thể có các cuộc trò chuyện.
Và bạn bắt đầu thấy điều này với chatbot, phải không? Đó là lý do tại sao các chatbot rất dễ sử dụng, bởi vì bạn có thể có một cuộc trò chuyện thực sự. Nhưng sau đó tôi có thể nói chuyện thậm chí còn tốt hơn và mạnh mẽ hơn, tôi nghĩ vậy.
Xu hướng kinh doanh nhỏ: Bạn có coi con bạn là một phần của tiếng nói thế hệ đầu tiên không?
Dave Isbitski: Vâng, người lớn tuổi nhất của tôi, bây giờ tôi có một thiếu niên, vì vậy cô ấy tuân thủ COPPA. Đối với công nghệ, cô được sử dụng nhiều thứ hơn. Cô ấy có thể có tài khoản của riêng mình, và tất cả những thứ đó. Nhưng vì cha của họ, rõ ràng, họ đã ở quanh đó cả đời. Nhưng thật thú vị khi nhìn thấy họ bây giờ với các đồng nghiệp của họ, và chỉ sử dụng công nghệ. Tất cả mọi thứ thông qua phương tiện truyền thông xã hội và điện thoại. Các chuẩn mực xã hội, mà một số điều bạn sẽ thấy thay đổi, phải không? Hãy nghĩ về 10 năm đối mặt, nhìn vào màn hình và những thứ tương tự. Nếu bạn chỉ cho ai đó 50 năm trước, họ sẽ nghĩ đó là sự điên rồ, thì sao Tại sao mọi người lại thích điều này?
Các chuẩn mực xã hội, ngay cả trong gia đình của chúng tôi, khi chúng tôi có Echo lần đầu tiên, chúng tôi phải tạo ra một quy tắc xã hội, nếu ai đó chơi nhạc, bạn không đi vào phòng và, Hủy bỏ. Vì các con tôi sẽ làm điều đó lẫn nhau, hoặc nếu tôi đang làm gì đó, bạn chỉ cần không bước vào và sau đó yêu cầu bất cứ điều gì.
Có một sự lịch sự mà bạn phải hiểu về công nghệ. Và chúng tôi cũng có những quy tắc tương tự trong nhà tôi, xung quanh màn hình. Bạn nhận được bao nhiêu thời gian, không có màn hình trên bàn, và vì vậy tôi nghĩ rằng, điều mà Lừa cũng khiến tôi quan tâm, là để xem những chuẩn mực xã hội đó thay đổi theo thời gian như thế nào.
Thông báo đẩy hiện đang hoạt động trong các thiết bị Echo. Bạn thấy đèn xanh và bạn biết một gói hàng đang đến. Nhưng chúng tôi cũng sẽ mở ra cho các nhà phát triển. Và vì vậy tôi nghĩ, lý do, ít nhất là đối với tôi, tại sao tôi lại kiểm tra màn hình của mình rất nhiều, là mọi thứ đều có khả năng là một cảnh báo ưu tiên. Vì bạn không biết.
Một email đến, một tin nhắn văn bản đến, bạn không biết. Vì vậy, có một AI biết những gì tôi quan tâm và biết khi nào làm phiền tôi, đột nhiên có sự bình yên mà bạn hoặc bạn có thể ra ngoài ăn tối, tôi không cần phải nhìn xuống điện thoại của mình, vì AI sẽ đi nói cho tôi biết nếu vợ tôi cần tôi, hoặc nếu có chuyện gì xảy ra tại nơi làm việc, hoặc nếu đi làm của tôi sẽ bị hút khi tôi rời khỏi nhà hàng.
Vì vậy, tôi nghĩ rằng chuẩn mực xã hội có thể thay đổi. Tôi rất thích trở thành ông nội từ nhiều năm nay, ngồi cùng các con trong một nhà hàng và mọi người trở lại làm người.
$config[code] not foundĐây là một phần của loạt Phỏng vấn Một đối một với các nhà lãnh đạo tư tưởng. Bảng điểm đã được chỉnh sửa để xuất bản. Nếu đó là một cuộc phỏng vấn bằng âm thanh hoặc video, hãy nhấp vào trình phát được nhúng ở trên hoặc đăng ký qua iTunes hoặc qua Stitcher.