DevOps e Escalabilidade

AWS Lambda + CaptchaAI: solução de CAPTCHA sem servidor

O AWS Lambda lida com a resolução de CAPTCHA sem gerenciar servidores. Pague apenas ao resolver, dimensione automaticamente e integre com API Gateway, SQS ou Step Functions.


Manipulador Lambda

# lambda_function.py
import json
import os
import time
import urllib.request
import urllib.parse


def lambda_handler(event, context):
    """AWS Lambda handler for CaptchaAI solving."""
    api_key = os.environ["CAPTCHAAI_KEY"]

    # Parse input
    body = json.loads(event.get("body", "{}")) if isinstance(event.get("body"), str) else event

    method = body.get("method", "userrecaptcha")
    params = body.get("params", {})

    try:
        token = solve_captcha(api_key, method, params)
        return {
            "statusCode": 200,
            "body": json.dumps({"token": token}),
        }
    except Exception as e:
        return {
            "statusCode": 500,
            "body": json.dumps({"error": str(e)}),
        }


def solve_captcha(api_key, method, params, timeout=90):
    """Solve CAPTCHA using CaptchaAI API."""
    # Submit task
    submit_data = urllib.parse.urlencode({
        "key": api_key,
        "method": method,
        "json": 1,
        **params,
    }).encode()

    req = urllib.request.Request(
        "https://ocr.captchaai.com/in.php",
        data=submit_data,
    )
    with urllib.request.urlopen(req, timeout=30) as resp:
        result = json.loads(resp.read())

    if result.get("status") != 1:
        raise RuntimeError(f"Submit error: {result.get('request')}")

    task_id = result["request"]

    # Poll for result
    start = time.time()
    while time.time() - start < timeout:
        time.sleep(5)
        poll_url = (
            f"https://ocr.captchaai.com/res.php"
            f"?key={api_key}&action=get&id={task_id}&json=1"
        )
        with urllib.request.urlopen(poll_url, timeout=15) as resp:
            data = json.loads(resp.read())

        if data["request"] != "CAPCHA_NOT_READY":
            if data.get("status") == 1:
                return data["request"]
            raise RuntimeError(f"Solve error: {data['request']}")

    raise TimeoutError("Solve timeout")

Chave de API segura com Secrets Manager

import json
import boto3


def get_api_key():
    """Retrieve CaptchaAI key from AWS Secrets Manager."""
    client = boto3.client("secretsmanager")
    response = client.get_secret_value(SecretId="captchaai/api-key")
    secret = json.loads(response["SecretString"])
    return secret["api_key"]

Armazene o segredo:

aws secretsmanager create-secret \
  --name captchaai/api-key \
  --secret-string '{"api_key":"YOUR_API_KEY"}'

Modelo SAM (infraestrutura como código)

# template.yaml
AWSTemplateFormatVersion: "2010-09-09"
Transform: AWS::Serverless-2016-10-31

Globals:
  Function:
    Timeout: 120
    MemorySize: 256
    Runtime: python3.11

Resources:
  CaptchaSolverFunction:
    Type: AWS::Serverless::Function
    Properties:
      Handler: lambda_function.lambda_handler
      Environment:
        Variables:
          CAPTCHAAI_KEY: !Sub "{{resolve:secretsmanager:captchaai/api-key:SecretString:api_key}}"
      Events:
        SolveApi:
          Type: Api
          Properties:
            Path: /solve
            Method: post
      Policies:

        - AWSSecretsManagerGetSecretValuePolicy:
            SecretArn: !Sub "arn:aws:secretsmanager:${AWS::Region}:${AWS::AccountId}:secret:captchaai/api-key-*"

Outputs:
  SolveApiUrl:
    Value: !Sub "https://${ServerlessRestApi}.execute-api.${AWS::Region}.amazonaws.com/Prod/solve"

Implantar

# Build and deploy
sam build
sam deploy --guided

# Test
curl -X POST https://YOUR_API_ID.execute-api.us-east-1.amazonaws.com/Prod/solve \
  -H "Content-Type: application/json" \
  -d '{
    "method": "userrecaptcha",
    "params": {
      "googlekey": "SITE_KEY",
      "pageurl": "https://example.com"
    }
  }'

Processamento em lote acionado por SQS

Processe tarefas CAPTCHA de uma fila SQS:

import json
import os
import time
import urllib.request
import urllib.parse


def sqs_handler(event, context):
    """Process CAPTCHA tasks from SQS queue."""
    api_key = os.environ["CAPTCHAAI_KEY"]
    results = []

    for record in event["Records"]:
        task = json.loads(record["body"])
        try:
            token = solve_captcha(
                api_key,
                task["method"],
                task["params"],
            )
            results.append({
                "task_id": task.get("id"),
                "status": "success",
                "token": token[:50],
            })
        except Exception as e:
            results.append({
                "task_id": task.get("id"),
                "status": "error",
                "error": str(e),
            })

    return {"results": results}

Considerações Lambda

Fator Valor
Tempo limite máximo 15 minutos (definido como 2 minutos para a maioria dos CAPTCHAs)
Memória 256 MB suficientes (sem processamento pesado)
Simultaneidade Padrão 1000 simultâneos (solicite aumento se necessário)
Início a frio ~ 500 ms para Python (insignificante versus tempo de resolução)
Custo ~$0,0001 por resolução (somente cálculo)
Dependências Use urllib (integrado) para evitar camadas Lambda

Solução de problemas

Problema Causa Correção
A função expira Tempo limite do Lambda <tempo de resolução Defina o tempo limite para 120s+
Permissão negada em segredo Política IAM ausente Adicionar política de leitura do SecretsManager
A inicialização a frio adiciona latência Invocações pouco frequentes Usar simultaneidade provisionada
Erro de importação para solicitações Não incluído no Lambda Use urllib.request (integrado) ou adicione camada

Perguntas frequentes

O Lambda é econômico para resolução de CAPTCHA?

Sim. Custando aproximadamente US$ 0,0001 por invocação (256 MB, 60 segundos), o Lambda adiciona um custo insignificante à taxa da API CaptchaAI. Você evita custos de servidor durante o tempo ocioso.

E quanto ao tempo limite de 15 minutos do Lambda?

A maioria dos CAPTCHAs resolve em 10 a 60 segundos. Defina o tempo limite do Lambda para 120 segundos. Para tipos complexos como reCAPTCHA Enterprise, use 180 segundos.

Posso usar camadas Lambda para a biblioteca de solicitações?

Sim, mas urllib.request (integrado) funciona bem para a API HTTP simples do CaptchaAI. Isso evita totalmente o gerenciamento de camadas.


Guias Relacionados

  • Funções do Google Cloud + CaptchaAI
  • Funções do Azure + CaptchaAI

Os comentários estão desativados para este artigo.