DevOps e Escalabilidade

Construindo soluções CAPTCHA orientadas a eventos com AWS SNS e CaptchaAI

A pesquisa de resultados CAPTCHA vincula os threads e cria um acoplamento forte entre o raspador e o pipeline de resolução. O AWS SNS (Simple Notification Service) dissocia essas preocupações: CaptchaAI envia resultados para seu retorno de chamada, que os publica no SNS, e qualquer número de consumidores downstream reage de forma independente.

Visão geral da arquitetura

[Scraper] → Submit CAPTCHA → [CaptchaAI API]
                                    ↓
                            Solve completes
                                    ↓
                            Callback → [API Gateway + Lambda]
                                    ↓
                            Publish → [SNS Topic]
                                    ↓
                    ┌───────────────┼───────────────┐
                    ↓               ↓               ↓
            [SQS Queue]      [Lambda Logger]   [Email Alert]
            (result store)   (audit trail)     (on failure)

O SNS fornece distribuição: um resultado CAPTCHA aciona vários consumidores sem que o manipulador de retorno de chamada saiba sobre eles.

Etapa 1: crie o tópico SNS

CLI da AWS

aws sns create-topic --name captcha-results --output text
# Returns: arn:aws:sns:us-east-1:123456789:captcha-results

Python (boto3)

import boto3

sns = boto3.client("sns", region_name="us-east-1")

response = sns.create_topic(Name="captcha-results")
topic_arn = response["TopicArn"]
print(f"Topic ARN: {topic_arn}")

Etapa 2: construir o receptor de retorno de chamada

Esta função Lambda recebe resultados de retorno de chamada CaptchaAI e os publica no SNS.

Python (manipulador Lambda)

import json
import os
import boto3

sns = boto3.client("sns")
TOPIC_ARN = os.environ["SNS_TOPIC_ARN"]


def lambda_handler(event, context):
    """Receive CaptchaAI callback and publish to SNS."""
    # Parse query parameters from API Gateway
    params = event.get("queryStringParameters", {}) or {}
    task_id = params.get("id", "")
    solution = params.get("code", "")

    if not task_id or not solution:
        return {"statusCode": 400, "body": "Missing id or code"}

    # Publish to SNS
    message = {
        "task_id": task_id,
        "solution": solution,
        "status": "solved"
    }

    sns.publish(
        TopicArn=TOPIC_ARN,
        Message=json.dumps(message),
        Subject="captcha-solved",
        MessageAttributes={
            "task_id": {
                "DataType": "String",
                "StringValue": task_id
            }
        }
    )

    return {"statusCode": 200, "body": "OK"}

JavaScript (manipulador Lambda)

const { SNSClient, PublishCommand } = require("@aws-sdk/client-sns");

const sns = new SNSClient({ region: "us-east-1" });
const TOPIC_ARN = process.env.SNS_TOPIC_ARN;

exports.handler = async (event) => {
  const params = event.queryStringParameters || {};
  const taskId = params.id;
  const solution = params.code;

  if (!taskId || !solution) {
    return { statusCode: 400, body: "Missing id or code" };
  }

  const message = {
    task_id: taskId,
    solution: solution,
    status: "solved",
  };

  await sns.send(
    new PublishCommand({
      TopicArn: TOPIC_ARN,
      Message: JSON.stringify(message),
      Subject: "captcha-solved",
      MessageAttributes: {
        task_id: { DataType: "String", StringValue: taskId },
      },
    })
  );

  return { statusCode: 200, body: "OK" };
};

Etapa 3: enviar CAPTCHAs com o URL de retorno de chamada

Aponte pingback de CaptchaAI para o endpoint do API Gateway:

Pitão

import os
import requests

API_KEY = os.environ["CAPTCHAAI_API_KEY"]
CALLBACK_URL = os.environ["CALLBACK_GATEWAY_URL"]  # API Gateway URL


def submit_captcha(sitekey, pageurl):
    """Submit CAPTCHA with SNS-backed callback."""
    resp = requests.post("https://ocr.captchaai.com/in.php", data={
        "key": API_KEY,
        "method": "userrecaptcha",
        "googlekey": sitekey,
        "pageurl": pageurl,
        "pingback": CALLBACK_URL,
        "json": 1
    })
    data = resp.json()

    if data.get("status") == 1:
        return data["request"]  # task_id
    raise RuntimeError(f"Submit failed: {data.get('request')}")

Etapa 4: inscrever consumidores

Fila SQS (armazenamento de resultados)

# Subscribe an SQS queue to receive all results
sqs_arn = "arn:aws:sqs:us-east-1:123456789:captcha-results-queue"

sns.subscribe(
    TopicArn=topic_arn,
    Protocol="sqs",
    Endpoint=sqs_arn
)

Lambda (registrador de auditoria)

# Subscribe a Lambda for audit logging
lambda_arn = "arn:aws:lambda:us-east-1:123456789:function:captcha-audit-logger"

sns.subscribe(
    TopicArn=topic_arn,
    Protocol="lambda",
    Endpoint=lambda_arn
)

E-mail (alertas de falha)

# Subscribe email for error notifications with filter
sns.subscribe(
    TopicArn=topic_arn,
    Protocol="email",
    Endpoint="ops@example.com"
)

Etapa 5: consumir resultados do SQS

Seu raspador lê soluções do SQS em vez de pesquisar CaptchaAI:

Pitão

import json
import boto3

sqs = boto3.client("sqs", region_name="us-east-1")
QUEUE_URL = os.environ["SQS_QUEUE_URL"]


def get_solved_captcha(timeout=30):
    """Wait for a CAPTCHA solution from the SQS queue."""
    response = sqs.receive_message(
        QueueUrl=QUEUE_URL,
        MaxNumberOfMessages=1,
        WaitTimeSeconds=min(timeout, 20)  # Long polling (max 20s)
    )

    messages = response.get("Messages", [])
    if not messages:
        return None

    msg = messages[0]
    # SNS wraps the message — unwrap it
    sns_envelope = json.loads(msg["Body"])
    result = json.loads(sns_envelope["Message"])

    # Delete message after processing
    sqs.delete_message(
        QueueUrl=QUEUE_URL,
        ReceiptHandle=msg["ReceiptHandle"]
    )

    return result

JavaScript

const {
  SQSClient,
  ReceiveMessageCommand,
  DeleteMessageCommand,
} = require("@aws-sdk/client-sqs");

const sqs = new SQSClient({ region: "us-east-1" });
const QUEUE_URL = process.env.SQS_QUEUE_URL;

async function getSolvedCaptcha(timeout = 30) {
  const response = await sqs.send(
    new ReceiveMessageCommand({
      QueueUrl: QUEUE_URL,
      MaxNumberOfMessages: 1,
      WaitTimeSeconds: Math.min(timeout, 20),
    })
  );

  const messages = response.Messages || [];
  if (messages.length === 0) return null;

  const msg = messages[0];
  const snsEnvelope = JSON.parse(msg.Body);
  const result = JSON.parse(snsEnvelope.Message);

  await sqs.send(
    new DeleteMessageCommand({
      QueueUrl: QUEUE_URL,
      ReceiptHandle: msg.ReceiptHandle,
    })
  );

  return result;
}

Filtragem de mensagens SNS

Encaminhe resultados diferentes para consumidores diferentes:

# Only send failures to the ops queue
sns.subscribe(
    TopicArn=topic_arn,
    Protocol="sqs",
    Endpoint=failure_queue_arn,
    Attributes={
        "FilterPolicy": json.dumps({
            "status": ["failed", "error"]
        })
    }
)

Solução de problemas

Problema Causa Correção
Retorno de chamada retorna 403 Bloqueio de autenticação do API Gateway CaptchaAI Desative a autenticação na rota de retorno de chamada; use validação baseada em token
Mensagens SQS não chegam Permissão SNS → SQS ausente Adicionar permissão sns:Publish à política de fila SQS
Resultados duplicados processados SNS entrega pelo menos uma vez Implemente idempotência – verifique task_id antes de processar
Lambda cold start atrasa retorno de chamada Simultaneidade provisionada não definida Habilite a simultaneidade provisionada para o callback Lambda

Perguntas frequentes

Por que usar o SNS em vez de processar os resultados diretamente no callback Lambda?

O SNS desacopla o manipulador de retorno de chamada da lógica downstream. Você pode adicionar novos consumidores (registro, alertas, análises) sem modificar o retorno de chamada do Lambda. O retorno de chamada permanece simples e rápido.

Qual é a latência adicionada da camada SNS?

O SNS adiciona 10 a 50 ms por mensagem. Como a resolução do CAPTCHA leva de 5 a 30 segundos, essa sobrecarga é insignificante.

Posso usar SNS FIFO para processamento de pedidos?

Sim. Use um tópico SNS FIFO com fila SQS FIFO se precisar de resultados ordenados. Defina MessageGroupId como o ID da tarefa para ordenação por tarefa.

Artigos relacionados

Próximas etapas

Crie soluções CAPTCHA orientadas a eventos -obtenha sua chave API CaptchaAIe conecte-o ao pipeline de eventos da AWS.

Guias relacionados:

Os comentários estão desativados para este artigo.