O mesmo site mostra um desafio reCAPTCHA em inglês para um visitante e em japonês para outro. Um widget Cloudflare Turnstile renderiza seu texto de carregamento no idioma do navegador. Alguns sites oferecem tipos de CAPTCHA completamente diferentes com base na região detectada pelo visitante. Compreender como a localização afeta os CAPTCHAs ajuda a lidar com eles corretamente na automação.
O que muda com a localidade
| Provedor CAPTCHA | O que localiza | O que permanece o mesmo |
|---|---|---|
| reCAPTCHA | Texto da interface do usuário, rótulos de imagens, idioma do áudio | Sitekey, fluxo de verificação, formato de token |
| Torniquete | Texto do widget e mensagens de erro | Sitekey, formato de token, mecanismo de resolução |
| hCaptcha | Instruções do desafio, rótulos de categoria | Sitekey, formato de token |
| Imagem/OCR | Conjunto de caracteres, idioma do texto | Formato de imagem, fluxo submit/poll |
Como o idioma é detectado
Os provedores de CAPTCHA determinam o idioma por meio de vários sinais:
1. Cabeçalho Accept-Language
Accept-Language: ja-JP,ja;q=0.9,en-US;q=0.8,en;q=0.7
Isso informa ao servidor: prefira japonês (Japão), depois inglês (EUA) e depois inglês genérico. reCAPTCHA e Turnstile usam isso para selecionar o idioma da IU.
2. Parâmetro HTML hl
O reCAPTCHA aceita um parâmetro de idioma explícito quando carregado:
<!-- Force English reCAPTCHA -->
<script src="https://www.google.com/recaptcha/api.js?hl=en"></script>
<!-- Force Japanese -->
<script src="https://www.google.com/recaptcha/api.js?hl=ja"></script>
O parâmetro hl substitui o cabeçalho Accept-Language. Ao resolver, você não precisa corresponder isso — CaptchaAI retorna um token, independentemente do idioma da UI.
3. Localização Geo-IP
Algumas configurações de CAPTCHA variam de acordo com a região:
| Sinal | Efeito |
|---|---|
| IP da China | Pode obter GeeTest em vez de reCAPTCHA (o reCAPTCHA está bloqueado na China) |
| IP da UE | Pode ver o consentimento do GDPR antes do CAPTCHA |
| IP da região restrita | Pode receber desafios mais rigorosos |
4. Navegador navigator.language
CAPTCHAs baseados em JavaScript leem a linguagem do navegador:
navigator.language // "en-US"
navigator.languages // ["en-US", "en", "ja"]
Em navegadores headless, o padrão é a localidade do sistema. Defina-os explicitamente para corresponder ao seu alvo:
// Playwright
const context = await browser.newContext({
locale: 'ja-JP',
});
// Puppeteer
const page = await browser.newPage();
await page.setExtraHTTPHeaders({
'Accept-Language': 'ja-JP,ja;q=0.9',
});
Impacto na resolução
CAPTCHAs baseados em token (reCAPTCHA, Turnstile, hCaptcha)
As configurações de idioma afetam a IU, mas não o token. O processo de resolução do CaptchaAI é independente do idioma:
- Envie a chave do site e o URL da página
- CaptchaAI retorna um token válido
- O token funciona independentemente do idioma exibido pelo widget CAPTCHA
Nenhum parâmetro de idioma é necessário ao chamar CaptchaAI para CAPTCHAs baseados em token.
CAPTCHAs de imagem
A linguagem afeta diretamente os personagens da imagem:
| Idioma do site | Conteúdo CAPTCHA | Parâmetro de idioma CaptchaAI |
|---|---|---|
| Inglês | "Digite o texto: XKCD42" | 0 (padrão/Latin) |
| Russo | "Texto: ШКАФ" | 1 (cirílico) ou 2 |
| Chinês | "请输入验证码: 汉字" | 2 (não latino) |
| Árabe | "أدخل النص: عربي" | 2 (não latino) |
| Japonês | "文字を入力: ひらがな" | 2 (não latino) |
CAPTCHAs de áudio
Os desafios de áudio reCAPTCHA são falados no idioma que corresponde ao parâmetro hl ou ao cabeçalho Accept-Language. CaptchaAI lida com isso por meio de seu fluxo de resolução reCAPTCHA padrão – o método de resolução não depende da linguagem do áudio.
Problemas comuns de localização
Linguagem incompatível entre raspador e alvo
Se o seu raspador enviar Accept-Language: en-US para um site japonês, o CAPTCHA poderá ser renderizado em inglês – o que é adequado para CAPTCHAs baseados em token, mas pode causar problemas se o site validar a consistência do idioma.
Diferenças regionais de provedores de CAPTCHA
Alguns países usam diferentes provedores de CAPTCHA:
| Região | Provedores típicos |
|---|---|
| Mercados ocidentais | reCAPTCHA, catraca, hCaptcha |
| China | GeeTest, Tencent CAPTCHA, imagem personalizada |
| Rússia/CIS | CAPTCHAs de imagem personalizados, reCAPTCHA |
| Coreia do Sul | Controles deslizantes personalizados, CAPTCHAs de imagem |
Solução de problemas
| Problema | Causa | Correção |
|---|---|---|
| reCAPTCHA mostra idioma diferente do esperado | Parâmetro hl na tag de script vs incompatibilidade de Accept-Language |
O token é independente do idioma – não afeta a resolução |
| Caracteres errados do CAPTCHA da imagem reconhecidos | O parâmetro de idioma não corresponde ao script CAPTCHA | Defina language=2 para CAPTCHAs não latinos |
| O site atende diferentes tipos de CAPTCHA por região | Seleção de provedor baseado em Geo-IP | Use proxy correspondente à região de destino |
| Navegador modo headless mostra localidade errada | Localidade padrão do sistema usada | Definir localidade explicitamente no contexto do navegador |
| Áudio CAPTCHA em linguagem inesperada | O parâmetro hl substitui o cabeçalho |
Não afeta a resolução baseada em token CaptchaAI |
Perguntas frequentes
O CaptchaAI precisa saber o idioma de exibição do CAPTCHA?
Para CAPTCHAs baseados em token (reCAPTCHA, Turnstile, hCaptcha), não. O processo de resolução é independente do idioma. Para CAPTCHAs Image/OCR, sim - defina o parâmetro language para corresponder ao conjunto de caracteres exibido na imagem.
Devo combinar meu cabeçalho Accept-Language com o site de destino?
É uma boa prática para consistência. Alguns sites verificam incompatibilidades de idioma entre cabeçalhos e outros sinais. Defina o cabeçalho Accept-Language para corresponder ao idioma principal do site para minimizar o risco de detecção.
A mesma chave de site pode mostrar diferentes dificuldades de CAPTCHA por localidade?
Sim. Os provedores de CAPTCHA podem ajustar a dificuldade com base nas pontuações de risco regionais. O tráfego proveniente de determinadas regiões poderá enfrentar desafios mais difíceis. Isso não afeta a resolução do CaptchaAI — a API lida com desafios de qualquer dificuldade.
Próximas etapas
Lide com CAPTCHAs em qualquer localidade —obtenha sua chave API CaptchaAIe defina as configurações de idioma corretamente.
Guias relacionados:
- Conjunto de caracteres CAPTCHA de imagem multilíngue
- Resolvendo CAPTCHAs em sites chineses
- Resolvendo CAPTCHAs em sites japoneses e coreanos