• Logo Picasso IA
    Logo Picasso IA
  • Início
  • IA Imagem
    Nano Banana 2
  • IA Vídeo
    Veo 3.1 Fast
  • IA Chat
    Gemini 3 Pro
  • Editar Imagens
  • Melhorar Imagem
  • Remover Fundo
  • Texto para Fala
  • Efeitos
    NEW
  • Gerações
  • Faturamento
  • Suporte
  • Conta
  1. Coleção
  2. Texto para Fala
  3. Tts 1.5 Mini

Explore vozes para sua necessidade

ASMR

ASMR

Japonês
Sussurro
Mulher Sussurrante

Mulher Sussurrante

Sussurro
Relaxamento
Robô Sortudo

Robô Sortudo

Robótico
Criativo
Pirata Furioso

Pirata Furioso

Personagem
Criativo

Ferramentas de Áudio

Áudio Original
Clonado
Resultado

Clone Sua Voz

Experimente a magia vocal instantânea com apenas 10 segundos de áudio!

Capitão Pirata
Capitão Pirata
Goblin Ganancioso
Goblin Ganancioso
Bela Sulista
Bela Sulista

Design de Voz

Crie Qualquer Voz Que Você Imaginar - A Partir de Uma Simples Descrição de Texto

TTS 1.5 Mini: Voz de IA instantânea em 15 idiomas

TTS 1.5 Mini converte texto escrito em fala com som natural em cerca de 120 milissegundos, tornando-se uma das opções mais rápidas disponíveis para quem precisa de áudio em escala. Se você grava narrações manualmente, sabe quanto tempo leva para regravar sempre que o roteiro muda. Este modelo permite iterar em segundos em vez de horas. O modelo oferece suporte a 15 idiomas por padrão, para que você possa produzir áudio para públicos internacionais sem gerenciar fluxos de trabalho separados. Você pode controlar a velocidade da fala, o tom emocional e a expressividade por meio de configurações simples, além de alternar entre várias vozes predefinidas para combinar com o estilo do seu conteúdo. Os formatos de saída incluem MP3, WAV, OGG e FLAC, e as taxas de amostragem chegam a 48 kHz para áudio com qualidade de transmissão. Seja para adicionar narração a um curso, automatizar a introdução de um podcast ou gerar áudio para uma demonstração de produto, TTS 1.5 Mini se encaixa diretamente no seu processo de produção sem exigir nenhum conhecimento de programação. Abra o modelo, cole seu roteiro, escolha uma voz e baixe o arquivo de áudio em segundos. É uma opção prática para quem precisa de conversão de texto em fala rápida e confiável de forma नियमित.

Oficial

Inworld

15.4k execuções

Tts 1.5 Mini

2026-03-10

Uso comercial

TTS 1.5 Mini: Voz de IA instantânea em 15 idiomas

Índice

  • Visão geral
  • Como funciona
  • Perguntas frequentes
  • Custo de Créditos
  • Recursos
  • Casos de uso
Obtenha Nano Banana Pro

Visão geral

TTS 1.5 Mini converte texto escrito em fala com som natural em cerca de 120 milissegundos, tornando-se uma das opções de síntese mais rápidas disponíveis. Seja para um rascunho de narração, a locução de uma demonstração de produto ou uma notificação por voz para um aplicativo, você cola o texto, escolhe uma voz e recebe um arquivo de áudio limpo em segundos. Disponível no Picasso IA, ele cobre 15 idiomas, de modo que projetos multilíngues não exigem mais sessões de gravação separadas nem ferramentas diferentes para cada localidade. O resultado é um fluxo de trabalho no qual você pode iterar em várias tomadas no tempo que antes levava para preparar uma única gravação.

Como funciona

  • Cole até 2.000 caracteres de texto no campo de entrada. Você pode incluir tags de pausa para intervalos temporizados, marcadores emocionais como [happy] ou [sad], e sons não verbais como [laugh] ou [sigh] para moldar a entrega.
  • Selecione uma voz na lista predefinida (Ashley, Dennis, Alex e outras) ou insira um ID de voz personalizado se você tiver uma voz clonada salva.
  • Escolha o formato de áudio: MP3, WAV, OGG Opus ou FLAC. Selecione uma taxa de amostragem de 8.000 Hz até 48.000 Hz para corresponder à especificação técnica do seu projeto.
  • Ajuste a velocidade da fala se precisar de uma entrega mais rápida ou mais lenta, e defina a temperatura para controlar o quão expressiva ou neutra a voz soa.
  • Ative, desative ou deixe no automático a normalização de texto para que números, datas e abreviações sejam lidos de forma natural.
  • Clique em gerar. TTS 1.5 Mini processa a entrada e retorna seu arquivo de áudio em cerca de 120 milissegundos.

Perguntas frequentes

Preciso de habilidades de programação ou conhecimento técnico para usar isto? Não, basta abrir TTS 1.5 Mini no Picasso IA, ajustar as configurações desejadas e clicar em gerar.

É gratuito para testar? Sim, você pode executar TTS 1.5 Mini sem nenhuma configuração de conta ou pagamento para começar. Envie seu texto, escolha uma voz e baixe o arquivo.

Quanto tempo leva para obter os resultados? O modelo tem como meta cerca de 120 milissegundos de latência entre a solicitação e a saída de áudio. Para a maioria das entradas, o arquivo fica pronto quase assim que você clica em gerar.

Quais formatos de saída são compatíveis? TTS 1.5 Mini exporta áudio em MP3, WAV, OGG Opus e FLAC. Você também pode selecionar entre sete opções de taxa de amostragem, de 8.000 Hz a 48.000 Hz, para atender aos requisitos técnicos da sua plataforma.

Posso personalizar a voz ou o estilo de fala? Sim. Escolha entre nomes de vozes predefinidas ou forneça um ID de voz clonada personalizado. O parâmetro de temperatura controla a expressividade: valores mais baixos fornecem um tom consistente e neutro; valores mais altos adicionam mais variação. O controle deslizante de velocidade da fala permite desacelerar ou acelerar a narração.

Quais idiomas TTS 1.5 Mini suporta? Ele oferece suporte a 15 idiomas, para que você possa produzir conteúdo de áudio multilíngue a partir de uma única ferramenta sem alternar entre serviços.

Onde posso usar os arquivos de áudio que baixo? Os arquivos de saída são limpos e sem marcas d'água adicionadas, então você pode colocá-los diretamente em edições de vídeo, podcasts, aplicativos móveis, módulos de e-learning ou qualquer projeto que precise de áudio falado.

Custo de Créditos

Cada geração consome 1 crédito

1 crédito

ou 5 créditos para 5 gerações

Recursos

Tudo o que este modelo pode fazer por você

120ms latency

Receba o áudio gerado em menos de 120 milissegundos, rápido o suficiente para uso em produção em tempo real.

15-language support

Sintetize fala em 15 idiomas diferentes a partir de uma única entrada de texto, sem configuração extra.

Preset voices

Escolha entre um conjunto de vozes nomeadas para combinar com diferentes estilos de conteúdo e expectativas do público.

Emotion markup

Use tags embutidas para adicionar felicidade, tristeza, risos e outros sinais emocionais diretamente no roteiro.

Multiple output formats

Baixe o áudio em MP3, WAV, OGG Opus ou FLAC para qualquer plataforma ou fluxo de publicação.

Flexible sample rates

Selecione entre 8 kHz e 48 kHz para equilibrar o tamanho do arquivo com a qualidade do áudio para o seu caso de uso específico.

Speaking rate control

Ajuste a velocidade de reprodução sem distorcer o tom nem perder clareza na voz sintetizada.

SSML break support

Insira pausas temporizadas em qualquer parte do roteiro usando tags padrão de marcação para controle preciso do ritmo.

Casos de uso

Gere narração para um curso online colando o roteiro da aula e selecionando uma voz predefinida que combine com o tom da sua marca

Adicione uma locução a um vídeo de demonstração de produto convertendo seu roteiro para MP3 e sincronizando-o no seu editor de vídeo

Produza introduções ou encerramentos de podcast em vários idiomas sem regravar manualmente cada versão

Crie versões em áudio de posts de blog para que os leitores possam ouvir em vez de ler, usando normalização automática de texto para tratar números e datas corretamente

Crie uma resposta por voz para um chatbot ou aplicativo enviando o texto da resposta ao modelo e baixando o clipe de áudio em segundos

Teste diferentes estilos de voz para um audiolivro alternando entre vozes predefinidas e ajustando a velocidade da fala até que o ritmo pareça certo

Gere áudio de suporte ao cliente multilíngue em 15 idiomas a partir de um único roteiro sem contratar talentos de voz separados para cada mercado

Adicione fala com marcação de emoção a vídeos explicativos usando tags integradas de marcação emocional para uma entrega mais expressiva e com som natural

Mudar Categoria

Efeitos

Texto para Imagem

Texto para Imagem

Texto para Vídeo

Modelos de Linguagem Extensos

Modelos de Linguagem Extensos

Texto para Fala

Texto para Fala

Super Resolução

Super Resolução

Sincronização Labial

Geração de Música com IA

Geração de Música com IA

Edição de Vídeo

Fala para Texto

Fala para Texto

Melhorar Vídeos com IA

Remover Fundos

Remover Fundos