A inteligência artificial (IA) transformou para sempre a antiga indústria de transcrição. O processamento avançado de linguagem natural (PNL) baseado em fala agora permite que o software transcreva a voz humana com uma precisão próxima do nível humano, levando apenas uma fração do tempo de um transcritor humano especialista.
Tradicionalmente implantados fortemente pela indústria jurídica e médica, os serviços de transcrição tornaram-se essenciais em quase todas as esferas de trabalho. As empresas os utilizam para fazer anotações durante reuniões virtuais, enquanto as plataformas de e-learning contam com eles para transcrever palestras e sessões interativas.
Não é de admirar, então, que o tamanho do mercado de fala para PNL esteja projetado para crescer a um CAGR de 28,61% entre 2024 e 2030, ano em que o mercado valerá US$ 96,2 bilhões.
No entanto, ainda permanece uma grande lacuna entre a promessa e a entrega. Várias ferramentas de transcrição baseadas em IA disponíveis atualmente são demasiado lentas, demasiado imprecisas ou simplesmente não funcionam tão bem para línguas não europeias.
O serviço de transcrição de IA da Taption afirma preencher essas lacunas no espaço de transcrição de IA. Junte-se a nós enquanto analisamos esta ferramenta para ver se ela cumpre sua promessa.
O que é toque?
Taption é uma ferramenta de transcrição baseada em IA que converte arquivos de áudio e vídeo em mais de 40 idiomas em texto editável, pesquisável e com carimbo de data/hora. Seus clientes incluem diversas grandes editoras de notícias, instituições governamentais e universidades.
Além da transcrição, o Taption também pode traduzir vídeos, analisar seu conteúdo para gerar resumos e itens acionáveis, converter arquivos de áudio em vídeo e converter transcrições existentes em legendas.
Taption afirma uma taxa de precisão de mais de 90% para suas transcrições. Funciona particularmente bem para chinês, japonês e coreano, ou idiomas CJK, onde várias outras ferramentas de transcrição líderes lutam com precisão.
Preços e recursos do Taption
Taption vem em três planos de preços – Standard, Premium e Bulk.
Padrão
A versão Standard é gratuita quando os usuários se inscrevem.
Ao contrário de algumas outras ferramentas de transcrição que usamos, o Taption não solicita informações de cartão de crédito durante o processo de inscrição.
Achamos que esse é um recurso útil, pois permite que os usuários tenham uma ideia da plataforma antes de decidirem se pagam pela ferramenta.
Quando os usuários se inscrevem na plataforma pela primeira vez, eles recebem 15 minutos de transcrição gratuita.
Quando os usuários esgotarem o tempo de transcrição de 15 minutos, eles poderão comprar mais minutos, que serão cobrados a US$ 8/hora.
Ele também tem um limite máximo de upload de arquivos de 2 GB.
Os usuários podem acessar recursos como editor de texto, dicionário pessoal de IA e 3 créditos de IA para analisar e resumir seus vídeos.
Prêmio
O plano Premium custa US$ 10,8/mês se cobrado anualmente e US$ 12/mês se cobrado mensalmente.
Possui todos os recursos do plano Standard, além de recursos adicionais, como:
- 120 minutos mensais gratuitos de uso, com minutos adicionais por US$ 6/hora
- Capacidade de personalizar o tamanho da fonte
- Escolhendo seu formato de arquivo preferido ao baixar uma transcrição,
- Aceitar links como fontes ao transcrever
- Capacidade de transcrever vários arquivos de uma vez
- Capacidade de editar um vídeo editando o texto
- Até 5 créditos para análises e resumos de IA
Assinatura em massa
A assinatura em massa custa US$ 62,1/mês quando cobrada anualmente e US$ 69/mês quando cobrada mensalmente. Possui todos os recursos do plano Premium, além de recursos adicionais úteis para empresas, como:
- 1.000 minutos mensais gratuitos de uso, com minutos adicionais por US$ 3/hora
- Acesso multiusuário
- Gerenciamento de permissões de usuário para restringir o acesso a determinados recursos
- Faturas com números de identificação fiscal e títulos personalizados relacionados ao empreendimento
- Até 30 créditos mensais para análises e resumos de IA
Taption também fornece integração de API personalizada mediante solicitação. Este recurso é cobrado de acordo com os requisitos do usuário.
Além disso, Taption não tem outros custos ocultos. Vale ressaltar também que todos os arquivos com duração inferior a 1 minuto são gratuitos para transcrição.
Em comparação com outras ferramentas de transcrição baseadas em IA disponíveis no mercado hoje, descobrimos que o Taption é uma das opções mais acessíveis.
Primeiros passos com o painel do Taption
Para começar a usar o Taption, os usuários precisam visitar a página inicial e clicar no botão Login no canto superior direito.
A inscrição é rápida e simples. O Taption permite que os usuários se inscrevam usando sua conta do Google, portanto não há necessidade de preencher formulários longos ou inserir dados de cartão de crédito.
Depois de se inscreverem, a primeira coisa que os usuários veem é a tela inicial do Taption. No canto superior direito, os usuários podem ver os créditos restantes.
Para transcrever arquivos de áudio ou vídeo, basta clicar no botão Upload e enviar seu arquivo.
Os usuários podem fazer upload de seus arquivos usando qualquer uma das diversas opções disponíveis. Observe, entretanto, que o plano padrão pode não permitir que os usuários façam upload usando um link.
Escolhemos a opção YouTube. Para usuários premium, Taption também permite transcrever vários vídeos ao mesmo tempo. Basta clicar no botão Adicionar na caixa de diálogo e adicionar os links para todos os vídeos que deseja transcrever.
Depois de adicionar todos os arquivos que deseja transcrever, clique no botão verde OK no canto inferior esquerdo. Para esta revisão, transcrevemos apenas um vídeo.
Clicar em OK abre uma nova caixa de diálogo com dois menus suspensos. Na primeira, o usuário deve selecionar o idioma da transcrição. Eles podem selecionar qualquer um dos mais de 40 idiomas suportados atualmente pelo Taption.
O próximo menu suspenso exige que os usuários selecionem o método de transcrição. Taption oferece quatro métodos de transcrição:
- Transcrição automatizada: Taption transcreve o vídeo no piloto automático sem mais informações. Esta é a configuração que a maioria dos usuários individuais provavelmente usaria.
- Importar arquivo SRT: esta é a opção que os usuários selecionariam quando tivessem um arquivo de legenda para acompanhar o vídeo.
- Importar arquivo de texto : este método é adequado para usuários que desejam um arquivo de texto sem carimbos de data e hora. Taption adiciona carimbos de data/hora e rótulos de alto-falante à transcrição.
- Manual: Selecionar Manual simplesmente gera uma transcrição vazia, que os usuários devem inserir manualmente. Não temos certeza do propósito dessa opção.
Para esta revisão, selecionamos a opção Transcrição Automatizada. A caixa então surgiu com mais três campos:
- Selecionar formato de saída : pergunta ao usuário se ele deseja que a transcrição seja rotulada por locutor, dividida por legendas/legendas ou formatada sem um método específico.
- Categoria : exige que o usuário especifique que tipo de conteúdo o vídeo contém, como jurídico, educacional, financeiro, etc. A Taption usa essas informações para melhorar a precisão da transcrição.
- Intervalo de tempo : esta opção permite que os usuários transcrevam apenas uma determinada seção do vídeo.
Por fim, depois de preenchidos todos os campos, clique em “Criar” para iniciar a transcrição.
Embora a mensagem na tela dissesse que o Taption leva quase tanto quanto a duração do vídeo para concluir a transcrição, ficamos agradavelmente surpresos ao ver que nosso vídeo de 20 minutos ficou pronto em 2 minutos, completo com etiquetagem do alto-falante.
Isso é rápido, mesmo para os padrões das ferramentas de transcrição mais avançadas existentes.
Também descobrimos que a transcrição tem mais de 90% de precisão, o que está de acordo com as afirmações da Taption. Observe que se você estiver usando o Taption para transcrever reuniões ao vivo, como uma chamada do Zoom, fatores externos, como ruído de fundo, podem afetar a qualidade da saída.
Assim que a transcrição estiver pronta, os usuários terão a opção de traduzi-la para outro idioma, compartilhá-la com outros usuários em sua organização ou exportá-la em seus formatos preferidos, como PDF, arquivo WebVTT, arquivo de vídeo MP4 e muito mais.
Próximas etapas com o painel
Taption tem uma interface de usuário bastante simples e limpa, e o painel não é desnecessariamente confuso. No entanto, isso não significa que não venha repleto de recursos. Aqui estão alguns dos mais importantes:
1. Análise de IA
O recurso de análise de IA pode executar várias funções, incluindo resumir e analisar vídeos e extrair informações acionáveis.
Os usuários precisam instruir a IA sobre o que desejam usando um prompt. O painel esquerdo também lista os prompts comumente usados como modelos para que os usuários não precisem digitar um prompt todas as vezes.
2. Traduzir
Com o Taption, você também pode traduzir sua transcrição para mais de 50 idiomas.
Basta navegar até o botão Traduzir no canto superior direito e selecionar seu idioma preferido.
Para efeitos desta revisão, escolhemos o espanhol. Taption traduziu toda a transcrição do nosso vídeo de 20 minutos do inglês para o espanhol em menos de um minuto.
O texto traduzido aparece em uma tela dividida, ao lado da transcrição original, completo com marcação do orador e carimbos de data/hora.
3. Editor de tempo
O Time Editor é um recurso poderoso oculto no menu de rodapé. Ele permite editar ou cortar certas partes do vídeo, enquanto o Taption sincroniza os carimbos de data e hora das transcrições.
Para editar o vídeo, os usuários precisam arrastar o mouse pelas formas de onda na parte inferior da tela. Ao arrastar o cursor, você notará o texto correspondente riscado em vermelho no painel superior da tela.
Agora, quando você reproduzir o vídeo novamente, o vídeo recortado e seu texto correspondente não farão mais parte do seu vídeo e de sua transcrição.
4. Exportando MP4 com legendas incorporadas
Taption permite aos usuários exportar seus vídeos transcritos em diversos formatos, incluindo MP4. Além disso, ao salvar o arquivo transcrito como MP4, os usuários podem optar por incorporar legendas em vários idiomas. Este é um recurso Taption poderoso que falta à maioria das outras ferramentas no mercado no momento.
Para fazer isso, selecione Exportar no canto superior direito e, no menu suspenso que é aberto, escolha a opção Arquivo de vídeo MP4.
Taption então pergunta se você deseja incorporar legendas. Você pode escolher qualquer uma das três opções disponíveis para dividir legendas.
No menu suspenso Dual Subtitles, você pode escolher as configurações de fonte, como tamanho e estilo da fonte, para cada um dos dois idiomas escolhidos para as legendas.
Como no nosso caso escolhemos inglês e espanhol, o Taption mostra essas duas opções pré-preenchidas.
5. Exportar em formato personalizado
Embora o Taption permita que as transcrições sejam exportadas em vários formatos, há momentos em que os usuários podem querer exportar em formatos personalizados, como um arquivo XML. Para fazer isso, selecione .txt ou .PDF como formato ao exportar e selecione Formato personalizado.
Isso abre uma nova tela onde os usuários podem definir seu próprio formato personalizado para exportar o arquivo transcrito.
Este é outro recurso interessante do Taption que ainda não encontramos em outras ferramentas de transcrição.
6. Adicione notas
Taption permite aos usuários adicionar notas às seções da transcrição. Como criamos uma transcrição rotulada pelo locutor, o Taption nos permite adicionar notas a cada seção falada por um locutor específico.
Para adicionar uma nota a uma seção, basta clicar na caixa quadrada à direita do texto. Taption, no entanto, não tem a capacidade de marcar pessoas nessas notas. Vimos esse recurso em alguns dos serviços de transcrição de IA mais recentes do mercado e esperamos que a equipe Taption possa considerar adicionar esse recurso no futuro.
7. Entrada rápida
Logo abaixo do painel de edição, Taption oferece aos usuários uma série de opções que são fáceis de perder.
Um dos recursos mais úteis deste menu de rodapé é a Entrada Rápida. É aqui que você insere palavras e frases complexas que usa com frequência ao digitar. Você pode então acessá-los pressionando as teclas de função durante a edição.
Esse recurso não deve ser confundido com o dicionário pessoal, que é acessado no canto superior direito.
8. Gerenciamento de contas
Os usuários podem definir permissões e controles de acesso na guia Gerenciamento no painel lateral. Esta guia não está visível para usuários do plano Padrão/Gratuito.
Para adicionar um novo usuário, clique no botão Adicionar novo membro e insira o ID de e-mail do usuário para convidá-lo para o Taption.
Depois que o novo usuário aceitar o convite, você poderá atribuir a ele qualquer uma das diversas funções disponíveis. Cada função vem com um conjunto de permissões que permitem ou restringem funções específicas.
Ajuda e suporte
A Taption está sediada em Seattle, EUA. A empresa oferece apenas suporte por e-mail. O tempo de resposta é rápido e todas as dúvidas são respondidas em 24 horas.
Uma seção de perguntas frequentes acessível no menu lateral fornece respostas às dúvidas mais comuns dos usuários.
Acreditamos que o Taption não é um aplicativo complexo e é improvável que os usuários enfrentem problemas graves ao usá-lo.
Toque em revisão
Descobrimos que o Taption é uma ferramenta simples, mas poderosa, que cumpre tudo o que promete.
O que amamos no Taption
- É super rápido. Na verdade, Taption é um dos serviços de transcrição mais rápidos que testamos.
- UI limpa, apesar de ser uma plataforma poderosa
- A edição é simples. Pode editar vídeos sem o uso de ferramentas de terceiros
- Preço muito razoável em comparação com a concorrência
- Suporta uma ampla variedade de idiomas e é especialmente eficaz para idiomas CJK
Onde há espaço para melhorias
- Integra-se apenas com alguns aplicativos selecionados
- Poderia usar um recurso de marcação
Em última análise, acreditamos que o Taption é uma ferramenta com ótima relação custo-benefício, que reúne muitos recursos sem ficar inchado. Recomendamos Taption para empresas e criadores de conteúdo individuais que procuram serviços de transcrição eficientes baseados em IA que atendam às suas necessidades.