Análises Técnicas

Localização CAPTCHA: como as configurações de idioma afetam os desafios

O mesmo site mostra um desafio reCAPTCHA em inglês para um visitante e em japonês para outro. Um widget Cloudflare Turnstile renderiza seu texto de carregamento no idioma do navegador. Alguns sites oferecem tipos de CAPTCHA completamente diferentes com base na região detectada pelo visitante. Compreender como a localização afeta os CAPTCHAs ajuda a lidar com eles corretamente na automação.

O que muda com a localidade

Provedor CAPTCHA O que localiza O que permanece o mesmo
reCAPTCHA Texto da interface do usuário, rótulos de imagens, idioma do áudio Sitekey, fluxo de verificação, formato de token
Torniquete Texto do widget e mensagens de erro Sitekey, formato de token, mecanismo de resolução
hCaptcha Instruções do desafio, rótulos de categoria Sitekey, formato de token
Imagem/OCR Conjunto de caracteres, idioma do texto Formato de imagem, fluxo submit/poll

Como o idioma é detectado

Os provedores de CAPTCHA determinam o idioma por meio de vários sinais:

1. Cabeçalho Accept-Language

Accept-Language: ja-JP,ja;q=0.9,en-US;q=0.8,en;q=0.7

Isso informa ao servidor: prefira japonês (Japão), depois inglês (EUA) e depois inglês genérico. reCAPTCHA e Turnstile usam isso para selecionar o idioma da IU.

2. Parâmetro HTML hl

O reCAPTCHA aceita um parâmetro de idioma explícito quando carregado:

<!-- Force English reCAPTCHA -->
<script src="https://www.google.com/recaptcha/api.js?hl=en"></script>

<!-- Force Japanese -->
<script src="https://www.google.com/recaptcha/api.js?hl=ja"></script>

O parâmetro hl substitui o cabeçalho Accept-Language. Ao resolver, você não precisa corresponder isso — CaptchaAI retorna um token, independentemente do idioma da UI.

3. Localização Geo-IP

Algumas configurações de CAPTCHA variam de acordo com a região:

Sinal Efeito
IP da China Pode obter GeeTest em vez de reCAPTCHA (o reCAPTCHA está bloqueado na China)
IP da UE Pode ver o consentimento do GDPR antes do CAPTCHA
IP da região restrita Pode receber desafios mais rigorosos

4. Navegador navigator.language

CAPTCHAs baseados em JavaScript leem a linguagem do navegador:

navigator.language       // "en-US"
navigator.languages      // ["en-US", "en", "ja"]

Em navegadores headless, o padrão é a localidade do sistema. Defina-os explicitamente para corresponder ao seu alvo:

// Playwright
const context = await browser.newContext({
  locale: 'ja-JP',
});

// Puppeteer
const page = await browser.newPage();
await page.setExtraHTTPHeaders({
  'Accept-Language': 'ja-JP,ja;q=0.9',
});

Impacto na resolução

CAPTCHAs baseados em token (reCAPTCHA, Turnstile, hCaptcha)

As configurações de idioma afetam a IU, mas não o token. O processo de resolução do CaptchaAI é independente do idioma:

  • Envie a chave do site e o URL da página
  • CaptchaAI retorna um token válido
  • O token funciona independentemente do idioma exibido pelo widget CAPTCHA

Nenhum parâmetro de idioma é necessário ao chamar CaptchaAI para CAPTCHAs baseados em token.

CAPTCHAs de imagem

A linguagem afeta diretamente os personagens da imagem:

Idioma do site Conteúdo CAPTCHA Parâmetro de idioma CaptchaAI
Inglês "Digite o texto: XKCD42" 0 (padrão/Latin)
Russo "Texto: ШКАФ" 1 (cirílico) ou 2
Chinês "请输入验证码: 汉字" 2 (não latino)
Árabe "أدخل النص: عربي" 2 (não latino)
Japonês "文字を入力: ひらがな" 2 (não latino)

CAPTCHAs de áudio

Os desafios de áudio reCAPTCHA são falados no idioma que corresponde ao parâmetro hl ou ao cabeçalho Accept-Language. CaptchaAI lida com isso por meio de seu fluxo de resolução reCAPTCHA padrão – o método de resolução não depende da linguagem do áudio.

Problemas comuns de localização

Linguagem incompatível entre raspador e alvo

Se o seu raspador enviar Accept-Language: en-US para um site japonês, o CAPTCHA poderá ser renderizado em inglês – o que é adequado para CAPTCHAs baseados em token, mas pode causar problemas se o site validar a consistência do idioma.

Diferenças regionais de provedores de CAPTCHA

Alguns países usam diferentes provedores de CAPTCHA:

Região Provedores típicos
Mercados ocidentais reCAPTCHA, catraca, hCaptcha
China GeeTest, Tencent CAPTCHA, imagem personalizada
Rússia/CIS CAPTCHAs de imagem personalizados, reCAPTCHA
Coreia do Sul Controles deslizantes personalizados, CAPTCHAs de imagem

Solução de problemas

Problema Causa Correção
reCAPTCHA mostra idioma diferente do esperado Parâmetro hl na tag de script vs incompatibilidade de Accept-Language O token é independente do idioma – não afeta a resolução
Caracteres errados do CAPTCHA da imagem reconhecidos O parâmetro de idioma não corresponde ao script CAPTCHA Defina language=2 para CAPTCHAs não latinos
O site atende diferentes tipos de CAPTCHA por região Seleção de provedor baseado em Geo-IP Use proxy correspondente à região de destino
Navegador modo headless mostra localidade errada Localidade padrão do sistema usada Definir localidade explicitamente no contexto do navegador
Áudio CAPTCHA em linguagem inesperada O parâmetro hl substitui o cabeçalho Não afeta a resolução baseada em token CaptchaAI

Perguntas frequentes

O CaptchaAI precisa saber o idioma de exibição do CAPTCHA?

Para CAPTCHAs baseados em token (reCAPTCHA, Turnstile, hCaptcha), não. O processo de resolução é independente do idioma. Para CAPTCHAs Image/OCR, sim - defina o parâmetro language para corresponder ao conjunto de caracteres exibido na imagem.

Devo combinar meu cabeçalho Accept-Language com o site de destino?

É uma boa prática para consistência. Alguns sites verificam incompatibilidades de idioma entre cabeçalhos e outros sinais. Defina o cabeçalho Accept-Language para corresponder ao idioma principal do site para minimizar o risco de detecção.

A mesma chave de site pode mostrar diferentes dificuldades de CAPTCHA por localidade?

Sim. Os provedores de CAPTCHA podem ajustar a dificuldade com base nas pontuações de risco regionais. O tráfego proveniente de determinadas regiões poderá enfrentar desafios mais difíceis. Isso não afeta a resolução do CaptchaAI — a API lida com desafios de qualquer dificuldade.

Próximas etapas

Lide com CAPTCHAs em qualquer localidade —obtenha sua chave API CaptchaAIe defina as configurações de idioma corretamente.

Guias relacionados:

Os comentários estão desativados para este artigo.