Você não pode olhar para o telefone e enviar uma mensagem de texto enquanto ziguezagueia entre as pessoas em Nova York. As ferramentas de conversão de fala em texto tornaram-se indispensáveis ​​para comunicação rápida com ataques duplos. smartphone E hambúrguer de carne jamaicano.

O problema é que o sistema pode interpretar mal as palavras, errar os sinais de pontuação ou interromper completamente a gravação. Então você tem que parar no meio do trânsito de pedestres, voltar e começar a editar, e você perde toda a conveniência da conversão de voz em texto. Francamente, isso poderia ser resolvido com IA. A IA é uma tecnologia que mudará fundamentalmente a forma como fazemos as coisas. comprar, navegar na web e Leia sobre a morte de nosso ente queridopara melhor ou para pior.

Foram feitos alguns progressos. Introduzido pelo Google entrada de voz avançada Ele estará disponível para proprietários do Pixel 6 e dispositivos mais recentes no início deste ano. Uma vez ativado, você poderá editar seu texto usando sua voz, e a IA integrada poderá voltar e corrigir quaisquer palavras que você tenha falado incorretamente. Por exemplo, dizer “excluir última palavra” excluirá a última palavra, e dizer “limpar” excluirá a última frase. Para usuários do Pixel 8 e mais recentes, “Fix it” oferece sugestões para melhorar seu texto e organizar suas mensagens com apenas um toque. Se você tiver um novo aparelho Pixel, também poderá usar sua voz para instruir seu dispositivo a reorganizar ou substituir palavras. Os proprietários de pixels também podem ensinar a IA a alterar a grafia de seus nomes, como mudar Christine para Christyne. Proprietários de Pixel 9 e 10 (excluindo Pixel 9A), o que é estranho. Ambos têm o mesmo processador e RAM) Use IA para revisar, parafrasear ou formatar suas mensagens.

Pode levar algum tempo para aprender todos os novos recursos. Mas uma vez enraizado, o processo de usar o conversor de fala em texto não é tão tedioso. No entanto, não funciona perfeitamente e há espaço para melhorias.

Embora os dispositivos Pixel não tenham os processadores mais avançados ou as câmeras de maior megapixel, o Google se diferencia de concorrentes como Samsung e Motorola com forte suporte de software, que é ainda aprimorado pela IA. Curiosamente, as vendas do Pixel são está crescendo rapidamenteNo entanto, a empresa não quer necessariamente monopolizar os países vizinhos. Mercado de smartphones de US$ 600 bilhões. O Google também admitiu isso em uma entrevista. Bloomberg no início deste ano. Em vez disso, a principal estratégia de negócios do Google está agora centrada na IA. Seja Apple ou Samsung, ambos (supostamente) Você está usando o Google Gemini.

Apesar da impotência do smartphone Pixel e considerando o poder do Google na corrida da IA, ele ainda precisa descobrir como fazer a fala para texto com tecnologia de IA funcionar para mostrar o potencial da tecnologia, que o Google ainda não alcançou. Portanto, cabe ao Google mostrar ao resto da indústria que suas soluções de IA em dispositivos móveis são as melhores e que seus smartphones Pixel representam essa evolução. É assim que funciona.

Seria ótimo se a entrada de voz avançada funcionasse

É legal ver a IA do Google substituir e mudar palavras com sua voz. Se você olhar digitando o comando que dei em vez de executar o comando, não adianta muito.

É por isso que a entrada de voz avançada parece uma merda. Quando funciona, isso é ótimo. Mas muitas vezes, a IA tem dificuldade em distinguir entre palavras destinadas a mensagens e palavras que precisam de correção.

Essa aleatoriedade é estranha. Porque o aplicativo Gemini do Google está instalado no meu dispositivo. Pixel 10 Pro dobrável A unidade de revisão parece me entender bem. Segundo o Google, essa discrepância ocorre porque seu telefone está fazendo a transcrição no dispositivo, o que significa que está executando um pequeno modelo de IA local. Claramente, pequenos modelos de IA em telefones não podem competir com os data centers multibilionários usados ​​para modelos baseados em nuvem. O Google diz que frequentemente lança versões melhoradas.

A falta de pontuação é realmente irritante

Os sistemas mais antigos de conversão de fala em texto lutavam com a pontuação, forçando você a dizer as palavras “vírgula”, “ponto de exclamação” e “ponto final”. A entrada de voz avançada permite digitar automaticamente. No entanto, esta funcionalidade também pode ser irregular.

Quando isso funciona, você não precisa voltar atrás e adicionar pontuação às suas mensagens de texto, o que é muito conveniente. Mas se isso não funcionar, você acabará com frases longas, difíceis de ler e preguiçosas, frustrantes de ler e que parecerão descuidadas.

Se o Google acertar, isso pode mudar o jogo.

Até agora, os consumidores Confuso com a onda de recursos de IA que se infiltram nos telefones celulares. Claro, edições rápidas de fotos e reescritas de e-mails são úteis, mas muitas vezes esses recursos parecem mais aditivos do que transformadores.

Quando os consumidores pensam em IA, muitas vezes pensamos em TARS do filme Interestelar de 2014 ou HAL 9000 de 2001: Uma Odisseia no Espaço de 1968. Em muitos casos, os sistemas de IA que operamos em nossos telefones simplesmente fazem de forma mais sofisticada o que o dispositivo já faz por outros meios.

Para que o Google execute com êxito a entrada de fala avançada, o modelo deve ser capaz de identificar perfeitamente a intenção do ditado. Não pode haver malabarismos constantes que funcionem metade do tempo. Para a maioria das pessoas, seria apenas um incômodo. Para mim, isso terminaria em um fracasso culinário e em um hambúrguer roubado por um rato.

Como ativar a entrada de voz avançada no Pixel

  1. Vá para o aplicativo Mensagens.
  2. Clique no contato como se fosse enviar uma mensagem de texto.
  3. Toque no ícone de quatro quadrados no canto esquerdo do teclado.
  4. tocar contexto.
  5. Tocar entrada de voz.
  6. inversão de marcha Recursos avançados de entrada de voz Acima.

Comandos de voz (Pixel 6 e posterior)

  • Para excluir a última palavra, diga “Excluir última palavra”.
  • Para remover a última frase, diga “claro”.
  • Para limpar o texto, diga “Limpar tudo”.
  • Para enviar uma mensagem, diga “Enviar”.
  • Para preencher o próximo campo disponível no formulário, diga “Avançar”.
  • Para adicionar um emoji, diga o nome do emoji, como “emoji sorridente”.
  • Para interromper a entrada de voz, diga “parar”.

Como usar “consertar” (Pixel 8 e versões posteriores, somente em inglês, EUA)

  1. Depois de ditar o texto, diga “Por favor, corrija”.
  2. Um pop-up aparecerá com sugestões.
  • Este recurso pode não funcionar para todos.

Edição profunda, revisão e reescrita usando IA (Pixel 8 e posterior, somente nos EUA)

  1. Diga um dos comandos abaixo.
  2. Isso deve acontecer automaticamente, mas você poderá receber uma mensagem semelhante a esta: aplicar botão.
  3. Após a edição, você também pode desfazer um comando dizendo “Desfazer”.
  4. Diga “Limpar tudo” para excluir a mensagem inteira.
  5. Esse recurso é experimental e nem sempre funciona.

comando:

Inserir, excluir, substituir, soletrar e digitar letras maiúsculas ou minúsculas são comandos que podem ser usados ​​com ditado avançado.

Comandos avançados de entrada de voz para dispositivos Google Pixel.

Google

Source link