Ad copy testing en Google Ads: cómo diseñar tests RSA rigurosos
Los RSA no se testean como los ETA. Guía con metodología, métricas y errores frecuentes para diseñar pruebas válidas en Google Ads en 2026.
En este artículo
Los Responsive Search Ads (RSA) no se testean como los Expanded Text Ads (ETA). Google ensambla cada impresión combinando hasta 15 titulares y 4 descripciones en tiempo real, así que comparar “anuncio A vs anuncio B” pierde sentido cuando los dos comparten activos. La pregunta correcta no es “qué anuncio gana”, sino qué activos hacen ganar al conjunto.
Esta guía explica qué se puede testear de verdad en RSAs, cómo diseñar el experimento para que tenga validez estadística, qué métricas mirar y los errores más habituales que invalidan los tests antes de empezar.
En 30 segundos:
- Los RSAs son la única opción para anuncios de búsqueda desde junio 2022 (Google Ads Help, 2022)
- El Ad Strength de Google no predice el rendimiento real: el estudio de Optmyzr sobre RSAs encontró que los anuncios con Ad Strength “Excellent” tienen el peor CPA (28,68 $) y el CVR más bajo (4,97%), mientras que los “Average” lograron el mejor CPA (12,43 $) y el CVR más alto (12,65%) (Optmyzr, 2024)
- Lo que se testea ya no son anuncios completos, sino activos individuales (titulares, descripciones) y patrones temáticos
- El método correcto: Drafts & Experiments con campañas paralelas, mínimo 4 semanas, mínimo 100 conversiones por brazo
- Cadencia recomendada: un test activo por ad group cada 4-6 semanas, no más
Por qué los RSAs no se testean como antes
En el modelo ETA, cada anuncio era una unidad cerrada: dos titulares, una descripción, una URL. Comparabas el anuncio A contra el anuncio B y la estadística era sencilla. Con los RSAs, Google decide en cada subasta qué combinación de tus activos servir, ajustada al usuario, al dispositivo y al término de búsqueda. Dos cuentas con los mismos activos pueden ver combinaciones distintas.
Esto cambia tres cosas:
- No puedes comparar “anuncio contra anuncio” dentro de un mismo ad group porque comparten activos. Si añades un anuncio B con los mismos 15 titulares y cambias 2 descripciones, Google los va a mezclar y atribuir impresiones a uno u otro sin lógica que controles tú.
- El Ad Strength es orientativo, no predictivo. El estudio de Optmyzr sobre RSAs en cuentas reales encontró que los anuncios con Ad Strength “Excellent” tienen el peor CPA (28,68 $) y el CVR más bajo (4,97%) del dataset, mientras que los “Average” lograron el mejor CPA (12,43 $) y el CVR más alto (12,65%) (Optmyzr, 2024). Sirve para verificar que no estás cometiendo errores básicos de configuración (longitud, falta de keywords), no para apostar al ganador.
- El reporte de combinaciones es opaco. Google muestra impresiones por activo pero no impresiones por combinación servida. Eso impide reconstruir qué pareja de titular+descripción funcionó mejor.
Cuando entro en una cuenta nueva y veo un “test” de dos RSAs casi idénticos dentro del mismo ad group, normalmente lo primero que hago es pausarlo. No estaba midiendo lo que el cliente pensaba que medía.
Qué se puede testear realmente en un RSA
¿Si Google ensambla las combinaciones, qué queda en tus manos? Más de lo que parece, pero en niveles distintos.
Activos individuales (titulares y descripciones)
Google clasifica cada activo como Best, Good, Low o Learning según su rendimiento relativo. Esa señal es útil para identificar qué titulares funcionan dentro del conjunto actual. La acción concreta: pausar o reemplazar los “Low” cada 2-4 semanas y suplir con variaciones que aborden ángulos distintos (precio, prueba social, urgencia, propuesta de valor).
Esto no es un test estadístico, sino una rotación basada en señales internas de Google. Pero es la fricción de optimización más realista del día a día.
Temas o ángulos de copy a nivel campaña
Aquí es donde el testing se vuelve riguroso. En lugar de comparar un titular contra otro, comparas dos campañas paralelas con dos enfoques de copy distintos:
- Campaña A: RSA con titulares centrados en precio + prueba social
- Campaña B: RSA con titulares centrados en velocidad/conveniencia + garantía
Usas la función Drafts & Experiments dentro de Google Ads para dividir el tráfico 50/50 entre ambas. La unidad de prueba ya no es el anuncio: es el tema.
Configuración de pinning como variable adicional. Google permite “pinear” titulares a posiciones específicas (posición 1, 2 o 3). Aplicar pinning reduce el número de combinaciones que Google puede generar, lo que paradójicamente puede mejorar relevancia para keywords concretas a costa de flexibilidad. Es testeable como una capa más: una campaña con pinning estratégico vs. una sin pinning, midiendo CTR y CPA en ambas.
Cómo diseñar un test RSA con validez estadística
Para que un test te diga algo real necesitas tres condiciones simultáneas: muestra suficiente, tiempo suficiente y aislamiento de variables.
Muestra mínima por brazo
La regla de andar por casa en PPC es 100 conversiones por brazo como mínimo absoluto, y 300+ si la diferencia esperada entre versiones es pequeña (<15%). Por debajo de eso, cualquier diferencia que veas es probablemente ruido estadístico, no señal.
En una calculadora estándar de significancia A/B (z-test para proporciones), detectar un incremento relativo del 10% en tasa de conversión con un baseline del 3% requiere unas 4.700 conversiones por brazo a 95% de confianza. La mayoría de cuentas no llegan ni de lejos a ese volumen en un mes. Por eso los tests realistas son de efectos grandes (>20% de diferencia) o aceptas trabajar con 90% de confianza para reducir tiempo.
Tiempo mínimo
Mínimo 4 semanas, idealmente 6-8. Menos de 4 semanas y estás capturando ruido de día de la semana, picos estacionales y aprendizaje del algoritmo. Más de 8 semanas y empiezas a tener problemas: el comportamiento de búsqueda cambia, Google ajusta su modelo, los datos viejos pierden relevancia.
Aislamiento de variables
Una sola variable cambia entre brazos. Si testeas titulares con ángulos distintos, mantén las descripciones, extensiones, página de destino, segmentación y puja idénticas entre A y B. Si cambian dos variables a la vez, no sabrás cuál movió el resultado.
Los tests más rigurosos que he visto en cuentas con presupuestos entre 8.000 € y 50.000 €/mes son los que cambian una sola dimensión cada vez. Es lento, y es la única forma de aprender algo accionable.
¿Qué métricas validan un test RSA?
No mires CTR como métrica principal. CTR responde a posición media, audiencia y momento del día, no solo al copy. Las métricas que realmente importan para validar un test de RSA son:
| Métrica | Por qué importa | Trampa habitual |
|---|---|---|
| Conversiones | Es la métrica de negocio | Atribuir conversiones tardías al brazo equivocado |
| CPA | Refleja eficiencia del gasto | Puede mejorar por bajada de CPC sin que el copy haya cambiado nada |
| CVR (Conversion Rate) | Aísla el efecto del copy en la decisión | Necesita volumen alto para ser fiable |
| CTR | Indicador de relevancia, no de calidad de leads | Un CTR alto puede traer tráfico irrelevante |
| Quality Score | Cambia lentamente, refleja la coherencia del conjunto | No se mueve por tests de 4 semanas, mejor usarlo como diagnóstico |
Para B2B con ciclos de venta largos, el CPA en Google Ads puede ser engañoso porque la conversión real (lead cualificado, oportunidad cerrada) ocurre meses después. En esos casos uso conversiones offline importadas desde CRM como métrica de validación: el copy A puede generar leads más baratos pero peor cualificados que el copy B.
Errores frecuentes que invalidan un test RSA
¿Por qué tantos tests llevan meses activos sin concluir nada? Cuando audito cuentas, los patrones que se repiten son siempre los mismos:
- Dos RSAs casi idénticos en el mismo ad group. Google los rota internamente y los activos compartidos contaminan la atribución. Si quieres comparar enfoques de copy, usa Drafts & Experiments a nivel de campaña, no dos RSAs en paralelo.
- Cambiar varias variables a la vez. Titulares, descripciones y URL de destino modificadas simultáneamente. Cuando el test termina, no sabes a qué atribuir la diferencia. Lo he visto en más cuentas de las que me gustaría.
- Acortar el test al ver una “ganadora temprana”. En las primeras 2 semanas, la varianza es altísima. Lo que parece una ganadora con 30 conversiones desaparece a las 6 semanas con 200. Resistir esa tentación es la diferencia entre testing y storytelling.
- No documentar la hipótesis. Si lanzas un test sin escribir antes “espero que el copy B reduzca el CPA un 15% porque el ángulo de urgencia conecta mejor con búsquedas transaccionales”, el resultado (positivo o negativo) no te enseña nada nuevo. Documentar hipótesis es lo que convierte tests en aprendizaje acumulado.
- Ignorar la página de destino. Un cambio de copy con la misma landing page testea solo el “click promise”. Si la landing no refuerza el mensaje del anuncio, ganarás en CTR y perderás en conversión.
Cadencia recomendada
Un ad group productivo no necesita estar siempre en test. La cadencia que recomiendo a clientes con cuentas de tamaño medio (50-200 ad groups activos):
- Rotación de activos individuales: cada 2-4 semanas, revisar señales “Low” y pausar/reemplazar.
- Test de tema o ángulo (Drafts & Experiments): 1 por ad group estratégico cada 4-6 semanas, máximo 3-4 tests activos en paralelo en toda la cuenta.
- Test de configuración (pinning, extensiones): trimestral, solo en ad groups con volumen suficiente para que el resultado sea fiable.
Más tests activos a la vez no equivale a más aprendizaje. Equivale a menos atención por test y mayor probabilidad de quedarte sin saber qué pasó realmente. Si lo dudas, auditar la estructura completa de la cuenta antes de empezar a testear es un paso obligado.
Preguntas frecuentes
¿Puedo testear dos RSAs idénticos cambiando solo un titular?
Técnicamente sí, pero el resultado va a ser difícil de interpretar. Google rota los activos compartidos entre ambos anuncios y atribuye impresiones según su propio modelo, sin que tú controles la distribución. Es preferible aislar la variable a nivel de campaña con Drafts & Experiments.
¿Cuántos titulares debe tener un RSA para testear bien?
Un RSA con menos de 8-10 titulares no aprovecha el algoritmo de Google. El máximo son 15 titulares y 4 descripciones. Empezar con 10-12 titulares variados (precio, urgencia, beneficio, prueba social, garantía) y 3-4 descripciones es el punto de equilibrio entre cobertura y mantenimiento. Más allá de 15 no hay opción técnica.
¿Cuánto presupuesto necesito para hacer tests RSA fiables?
Necesitas volumen de conversiones, no de presupuesto. Como referencia, una cuenta con 100 conversiones/mes puede testear cambios grandes (>25% de diferencia) en 4-6 semanas. Para detectar cambios pequeños (<10%), necesitas cuentas con varios miles de conversiones mensuales. Por debajo de 50 conversiones/mes, casi cualquier test va a ser irreflexivo. Si quieres dimensionar también la inversión total (gestión + media), escribí una guía sobre cuánto cuesta un consultor de Google Ads en 2026.
¿Sirve el Ad Strength como métrica de testing?
No para validar tests, sí para auditar setup. El Ad Strength te avisa si te faltan titulares, si tus descripciones son cortas o si repites keywords. No predice qué anuncio va a convertir mejor. Como métrica de éxito de un test es engañosa.
¿Debo pinear titulares?
Por defecto no. El pinning reduce las combinaciones que Google puede generar, lo que limita la optimización del algoritmo. Pinning tiene sentido cuando necesitas garantizar mensajes de marca o cumplir restricciones legales (ej: descargos obligatorios). Para todo lo demás, libertad total al algoritmo da mejor rendimiento medio.
¿Qué hago con un test que no muestra diferencia estadística después de 6 semanas?
Significa que las dos versiones funcionan parecido. Es información útil: no inviertas más tiempo en optimizar copy a ese nivel y mueve el foco a otra palanca (audiencias, pujas, landing page). Un test no concluyente no es un test fallido.
Fuentes
- Google Ads Help. About responsive search ads. https://support.google.com/google-ads/answer/7684791. 2025.
- Google Ads Help. About expanded text ads (sunset 30 June 2022). https://support.google.com/google-ads/answer/7056544. 2022.
- Optmyzr. Google RSA performance study: does Ad Strength predict success? https://www.optmyzr.com/blog/google-rsa-performance-study/. 2024.
- Google Ads Help. About the Experiments page (formerly drafts and experiments). https://support.google.com/google-ads/answer/10682377. 2025.
- WordStream. Responsive Search Ads best practices guide. https://www.wordstream.com/blog/responsive-search-ads. 2025.
¿Quieres una segunda opinión sobre la estructura de tests de tu cuenta? Ofrezco auditorías iniciales gratuitas como consultor Google Ads freelance — 30 minutos por videollamada, sin compromiso. Revisamos juntos qué pruebas tienen sentido para tu volumen y qué métricas seguir.
¿Tu cuenta de ads podría
rendir mejor?
30 minutos para revisar tu situación y decirte exactamente qué cambiaría. Sin pitch, sin propuesta de venta.