Houve um tempo em que falar comandos ou fazer perguntas a uma máquina e receber uma resposta era algo saído de um futuro de ficção científica. Bem, para mais de 110 milhões de pessoas só nos EUA , esse é o seu presente diário. Segundo o Gartner, 30 % das pesquisas serão realizadas por voz em 2020 .
A voz é a interface padrão para os mais de 200 milhões de alto-falantes inteligentes que a Canalys prevê que existirão até o final de 2019 . Mas a maioria dos smartphones hoje também instalou algum tipo de assistente digital que permite uma interface de voz. A empresa de pesquisa Juniper Research estima que até 2023 haverá 8 bilhões de assistentes de voz digitais em uso . A maioria deles estará em smartphones, mas smart TVs, wearables, alto-falantes inteligentes e outros dispositivos IoT também experimentarão um crescimento significativo no seu uso por meio de comandos de voz.
O mercado de assistentes de voz digital é dominado por quatro grandes players:
- Google Assistente. Este assistente digital vem instalado em todos os telefones Android como parte do Google app. Claro, ele usa a pesquisa do Google para responder às suas perguntas. Outras propriedades do Google, como YouTube ou Google Maps, também estão intimamente ligadas ao assistente. As empresas podem expandir as capacidades do Assistente desenvolvendo Ações. Essas ações podem ser usadas para interagir com hardware (“Ok Google, apague as luzes da sala”) ou com qualquer outro serviço online (“Ok Google, dê-me as manchetes de hoje do meu site favorito”).
- AmazonAlexa. O assistente digital da Amazon está disponível de forma mais famosa na linha de alto-falantes inteligentes da Amazon, Echo. Mas, na verdade, está disponível em mais de 20.000 dispositivos, incluindo não apenas alto-falantes inteligentes ou wearables, mas também TVs e até carros. Alexa também permite a criação de aplicativos de voz por meio do Alexa Skills. A Amazon ainda permite a possibilidade de assinaturas premium para Skills , para que os editores possam monetizar seus esforços oferecendo mais opções de personalização ou uma cobertura mais detalhada. Alexa usa o Bing como mecanismo de busca.
- Apple Siri. O que começou em 2011 como um aplicativo iOS para iPhone é agora um assistente de voz digital completo incorporado em todos os produtos Apple, incluindo sua linha de smart TVs, alto-falantes e wearables. A Apple oferece o SiriKit para permitir que as empresas ampliem seus aplicativos e permitam interação de voz por meio do Siri. O mecanismo de busca padrão que o Siri usa é o Google, embora possa ser configurado para usar um mecanismo de busca diferente, como Duck Duck Go ou Bing.
- Microsoft Cortana. O assistente digital da Microsoft está disponível nativamente para Windows e em dispositivos Android e iOS como um aplicativo independente. A Cortana parece estar atrasada na adoção em relação a outros assistentes digitais, e a estratégia da Microsoft parece ser integrar a Cortana com outros assistentes digitais, em vez de competir com eles . A Microsoft também permite o desenvolvimento de Skills de terceiros para a Cortana, mas por enquanto apenas para o mercado dos EUA. Dada a mudança de estratégia, não está claro se as Cortana Skills se tornariam mais amplamente disponíveis. A Cortana usa o Bing como mecanismo de busca.
Índice
A pesquisa por voz não é apenas para dispositivos móveis, é para a nossa vida cotidiana
Os estágios iniciais da pesquisa por voz foram desencadeados pela adoção cada vez maior de telefones celulares. O Google Now, a encarnação anterior do Assistente, foi lançado em 2012 e o Siri foi lançado ainda antes, em 2011. Isso mudou com a introdução do Alexa em 2014. O assistente digital agora vivia em uma peça de hardware projetada para nunca sair de casa.
Os assistentes digitais agora estão incorporados em uma ampla variedade de dispositivos, de telefones a relógios, de TVs a carros. As pessoas agora podem interagir com eles em uma ampla gama de situações. Mas a forma como interagimos com o assistente é radicalmente diferente da interface de texto habitual dos motores de busca.
Como a pesquisa por voz é diferente da pesquisa baseada em texto
- Consultas mais complexas e mais longas. O reconhecimento de fala evoluiu muito nos últimos anos e agora permite consultas mais complexas do que há alguns anos. Isso leva o usuário a empregar uma linguagem mais natural para suas consultas e comandos.
- Mais perguntas. De acordo com uma pesquisa da seoClarity , mais de 15% das pesquisas por voz começam com como, o quê, onde, quando, por que e quem. Isso se deve à interface diferente em comparação com um mecanismo de pesquisa baseado em texto.
- Respostas curtas e concisas. Mesmo que o usuário possa usar consultas mais longas para expressar o que deseja que o assistente faça ou procure, as pessoas esperam respostas curtas e claras.
- Nenhuma hierarquia de informações visuais. Estamos habituados a utilizar e detectar pistas visuais para organizar o conteúdo e destacar os aspectos mais importantes daquilo que queremos transmitir ao usuário. O conteúdo de uma landing page deve ser repensado para interfaces somente de voz para identificar o que destacar e como fazê-lo sem as dicas visuais que um navegador permite.
- O vencedor leva tudo. Ao usar um mecanismo de pesquisa, você pode folhear os resultados da pesquisa e, mesmo que raramente chegue à segunda página do SERP, pode clicar em um link abaixo dos três primeiros resultados principais. Em uma interface de voz, as pessoas não obtêm uma página de resultados onde possam escolher para onde ir. O assistente digital retornará apenas um resultado.
- Pesquisa local. Considerando que entre 30 e 40% das pesquisas móveis são consultas locais, também podemos esperar uma elevada percentagem de consultas na pesquisa por voz para solicitar resultados locais.
Pesquisa de palavras-chave para pesquisa por voz
A principal diferença em fazer pesquisas de palavras-chave para voz em vez de texto é que você usará muito mais palavras-chave em linguagem natural. A maneira como falamos é completamente diferente da maneira como digitamos. Usamos frases naturais em vez de uma pequena sequência de palavras-chave.
Para descobrir quais palavras-chave segmentar, precisamos usar uma ferramenta de pesquisa semântica de palavras-chave. Responder ao público é a ferramenta mais utilizada nesses casos. Insira sua palavra-chave inicial e você receberá uma lista de perguntas com essa palavra-chave. Os dados são apresentados primeiro em um gráfico, que é bonito, mas não muito útil. Felizmente, você pode baixar os dados em um prático CSV.
A ferramenta de pesquisa de palavras-chave do Twinword também possui alguns filtros úteis para extrair ideias de palavras-chave. Você pode filtrar os resultados por intenção de pesquisa e por padrões de palavras-chave, o que permitiria ver apenas perguntas incluindo sua palavra-chave original.
Você também pode anotar o snippet “As pessoas também perguntam” na Pesquisa Google para descobrir mais oportunidades de palavras-chave.
Se você tiver uma central de atendimento ou um recurso de chat ao vivo ou chatbot, explore os dados dessas conversas para encontrar as perguntas mais frequentes.
Consultas 'Perto de mim'
Como as consultas locais representam uma grande parte da pesquisa por voz, você pode esperar muitas consultas que terminam com a frase “perto de mim”. Como em: “qual o melhor sushi perto de mim”, ou “qual a melhor academia perto de mim”. Como otimizar para isso? As empresas locais devem ter seus dados atualizados em diretórios como o Yelp, sites de avaliação como o Tripadvisor e serviços como o Kayak. Para os editores, os dados estruturados são a resposta.
Como otimizar seu conteúdo para pesquisa por voz
Otimize seu site para celular
A maioria das otimizações que você deve fazer em seu site para garantir que ele tenha um bom desempenho na pesquisa para celular também será benéfica para suas classificações de pesquisa por voz. Um dos fatores mais importantes é a velocidade do site. Quer a interface seja de voz ou de um dispositivo móvel, as pessoas esperam resultados rápidos.
Use AMP e dados estruturados
Os dados estruturados são fundamentais para ajudar o Google a compreender e analisar melhor o seu conteúdo, para que possa fornecer melhor ao seu público as respostas que procura. Você pode ajudar o Google a identificar pessoas, organizações, eventos, receitas, produtos, lugares.
AMP significa Accelerated Mobile Pages. É um projeto de código aberto lançado pelo Google que restringe a funcionalidade das páginas da web para aumentar drasticamente sua velocidade. AMP é frequentemente usado com dados estruturados, pois é isso que permite que as páginas AMP sejam apresentadas em resultados aprimorados na página de resultados de pesquisa.
Além disso, para os editores, exibir seu conteúdo por meio do formato AMP com dados estruturados é um dos requisitos para criar uma ação para o Google Assistant .
Existe um esquema de dados estruturados chamado “speakable” , atualmente em beta, que identifica seções de um artigo que são adequadas para reprodução de texto para voz. O conteúdo marcado com este esquema será identificado pelo Google Assistente como conteúdo que pode ser lido por meio de um dispositivo habilitado para Google Assistente. O conteúdo é atribuído à fonte e a URL é enviada ao dispositivo móvel do usuário.
Este esquema de dados estruturados está disponível apenas para usuários que falam inglês nos EUA, por meio de editores que estão no Google Notícias.
Responda às perguntas dos usuários de forma concisa
De acordo com uma pesquisa da Backlinko , o resultado típico da pesquisa por voz tem apenas 29 palavras, mas a contagem de palavras de uma página de resultados da pesquisa por voz é de 2.312 palavras. Isto não é contraditório. No primeiro caso, estamos falando do assistente digital respondendo a uma pergunta ou consulta específica. No segundo caso, a contagem de palavras refere-se à fonte da resposta. Não está claro se o Google favorece o conteúdo de formato longo como uma marca de qualidade ou se apenas mais conteúdo significa que há mais chances de uma página ser usada como resposta a uma consulta.
De qualquer forma, o que essas duas estatísticas combinadas nos dizem é que precisamos pensar sobre a estrutura do nosso conteúdo para que possamos abordar as ideias principais e as principais conclusões em parágrafos curtos que podem ser captados por um assistente de voz.
Escreva conteúdo fácil de ler e entender
Se você deseja que seu conteúdo seja usado em interação por voz, ele precisa ser fácil de ler e, acima de tudo, fácil de entender para seus leitores. Lembre-se de que os usuários não poderão usar dicas ou elementos visuais para entender melhor seu conteúdo, como títulos ou gráficos.
Lembre-se de que a maioria das consultas será feita usando linguagem de fala natural, como se estivessem conversando. Tenha isso em mente ao desenvolver seu conteúdo e escreva de forma coloquial ao responder perguntas específicas.
Busque uma classificação elevada e trechos em destaque
Este é um caso de correlação e não de causalidade. Mas há evidências, conforme analisado pela Backlinko em sua pesquisa de resultados de voz no Google Assistant, de que mais de 75% dos resultados da pesquisa por voz vêm das três primeiras posições no SERP e que 40% vieram de um snippet em destaque.
Esta é apenas mais uma prova de que o Google Assistant e outros assistentes de voz digital favorecerão resultados altamente confiáveis para garantir que satisfaçam a consulta do usuário na primeira resposta.
Como os trechos em destaque já são respostas curtas para perguntas específicas, faz sentido que o Assistente os use.
Isso significa que seus esforços de otimização para pesquisa do Google também terão um impacto mensurável na forma como seu conteúdo é usado por um assistente de voz digital.
Analise e responda à intenção do usuário
Identifique qual é a intenção do usuário para a qual você está fornecendo conteúdo. Três intenções principais do usuário podem ser respondidas por meio da pesquisa por voz. Primeiro é obter informações: o que é isso? como faço isso?. A segunda é navegar: onde é isso?. E a terceira e última intenção é agir: reservar mesa em restaurante, comprar um par de sapatos, obter uma lista de todos os shows musicais que acontecem neste fim de semana.
A L'Oreal tem implementado uma estratégia de conteúdo baseada em respostas a perguntas do tipo “Como fazer” . Sua pesquisa mostra que é isso que seus usuários procuram usando consultas de pesquisa por voz.
Construa sua confiança e autoridade
Como vimos, a pesquisa por voz é um jogo em que o vencedor leva tudo. Um assistente de voz digital não exibirá uma lista de resultados, mas fornecerá diretamente uma resposta a partir desses resultados de pesquisa. Como só podem fornecer um resultado, faz sentido que tendam a favorecer resultados de domínios com alta autoridade, mesmo que não sejam o resultado principal para essa consulta.
SEO local é fundamental para pesquisa por voz
Um grande volume de consultas de pesquisa por voz é para resultados locais. Otimizar para consultas locais de SEO não é tanto uma questão de produzir conteúdo com palavras-chave locais, mas de manter uma presença saudável e atualizada em determinados serviços e diretórios. Por exemplo, as empresas locais devem reivindicar a sua listagem no Google My Business , Bing Places for Business e Apple Maps Connect . Você poderia então ter um maior grau de controle das informações extraídas pelo Google Assistant, Alexa, Cortana e Siri, que também usa dados e análises do Yelp.
Os editores (e também as empresas locais) podem implementar dados estruturados para destacar elementos locais em seu conteúdo, da mesma forma que o Yelp e a Ticketmaster fazem para suas avaliações e eventos. Crie Google Actions ou Alexa Skills para permitir que os usuários interajam com seu conteúdo
Todos os principais assistentes de voz digital permitem a criação de aplicativos de voz para permitir aos usuários interagir com o seu conteúdo através dos assistentes.
O Google vai um pouco além e cria ações automaticamente para o seu conteúdo com base nos dados estruturados do seu site. Quando isso acontecer, o proprietário do seu site, conforme especificado nos dados do Google Search Console, receberá um e-mail. Então você pode reivindicar sua ação ou desativá-la.
Por exemplo, o Google criará uma ação para podcasts com base em seu feed RSS que permitirá aos usuários encontrar e reproduzir episódios em seus dispositivos por meio do Assistente. Guias de instruções, perguntas frequentes e receitas também usam marcação de dados estruturados para gerar ações automaticamente.
Conteúdo de nossos parceiros
Para editores de notícias, você já deve estar incluído no Google Notícias e usar AMP e dados estruturados em seus artigos para ser elegível para gerar automaticamente uma ação.
Os Publishers já começaram a desenvolver parcerias com o Google para desenvolver Ações especializadas. A Vogue lançou em 2017 um recurso onde os usuários podiam interagir com a publicação no Google Home para obter mais informações sobre determinadas histórias, contadas pelos próprios redatores.
Outras editoras, como Bloomberg ou The Washington Post , desenvolveram Alexa Skills que permitem aos usuários ouvir resumos diários das notícias mais importantes do dia.
O Daily Mail deu um passo além, ao colocar toda a sua edição diária no Alexa . Enquanto outros editores gravam eles próprios o áudio, neste caso, o Daily Mail usa os recursos automatizados de conversão de texto em fala do Alexa. Outra diferença é que, neste caso, o Daily Mail disponibiliza esse recurso apenas para seus assinantes atuais.
Você pode analisar o impacto da pesquisa por voz?
A resposta curta é não. Ainda não, pelo menos. Embora o Google diga desde pelo menos 2016 que deseja incluir análises de pesquisa por voz no Google Search Console, o fato é que, a partir de hoje, não há como analisar consultas e resultados de pesquisa por voz.
Existem alguns desafios que impedem o Google e outros provedores de análise de fornecer esse recurso:
- A primeira é que as consultas em linguagem natural tendem a ser mais longas do que as consultas baseadas em palavras-chave. E as pessoas formularão o que é essencialmente a mesma consulta usando palavras ou construções de frases diferentes. Isso significa que a mesma consulta terá muitas variações de baixo volume, o que dificulta a análise e a extração de insights significativos.
- O segundo desafio é que as consultas de pesquisa por voz costumam ser encadeadas, como se estivessem em uma conversa. Por exemplo, você pode perguntar a um assistente de voz digital: “Quem é Stephen Curry?”. O assistente retornará um resumo das conquistas das estrelas da NBA. Você pode perguntar “Qual é a altura dele?”, e o assistente saberá que você está se referindo a Stephen Curry. O problema fica mais complicado quando você percebe que ambas as dúvidas podem ser respondidas pelo assistente usando duas fontes de conteúdo diferentes.
Qualquer funcionalidade de análise de pesquisa por voz precisa levar em consideração os desafios e:
- Fornece uma maneira de agrupar consultas semelhantes e, ao mesmo tempo, dá aos analistas a liberdade de explorar quais são essas variações, para entender melhor a linguagem do usuário.
- Mostrar árvores conversacionais para entender como os usuários navegam pelas informações e quais consultas os mantêm em nosso conteúdo e quais fazem com que a consulta seja respondida com conteúdo de outros sites.
Os editores que desejam entender como a pesquisa por voz está impactando sua presença on-line podem começar analisando as consultas que levam as pessoas ao seu site e procurar consultas mais longas e conversacionais, bem como consultas formuladas como uma pergunta.
Você também pode realizar testes com diferentes assistentes de voz digital para verificar quais fontes eles usam para suas respostas (os assistentes de voz começam suas respostas com “de acordo com…”) e como isso se correlaciona com os SERPs na pesquisa do Google.
A pesquisa por voz já é o nosso presente
A mudança nos hábitos de consumo e o papel cada vez maior que os dispositivos inteligentes e os assistentes digitais desempenham na nossa vida quotidiana significam que a pesquisa por voz não é uma coisa do futuro. Já é um presente com o qual precisamos lidar.
Os editores precisam levar em consideração a mudança da interface, de referências textuais e visuais para apenas voz. É uma mudança que muda a forma como as pessoas acessam e consomem nosso conteúdo. A falta de análises confiáveis para compreender o desempenho da pesquisa por voz torna esse objetivo difícil de alcançar. Mas, como acontece com qualquer outra faceta da pesquisa, tudo se resume a desenvolver a confiança do seu público por meio de conteúdo confiável e de alta qualidade.