1. Mínimo de cuatro fuentes verificables
Toda ficha redactada por el autor debe respaldarse en, como mínimo, cuatro fuentes externas distintas (objetivo: 4-8). Una sola fuente nunca basta. Las fuentes se citan inline con superíndices [1][2][3][4] que enlazan a la nota al pie correspondiente, y se listan al final del bloque con badge de fiabilidad y fecha cuando procede.
En las piezas más densas (capitales de provincia, comarcas estrella, eventos UNESCO/FITN) el mínimo se eleva a 6 fuentes y se incluyen siempre datos cuantitativos verificables (años de declaración BIC, kilómetros, hectáreas, hitos históricos con fecha exacta).
2. Jerarquía de fiabilidad — 8 niveles
El sistema clasifica cada fuente con un campo fiabilidad que el lector ve como badge:
- Oficial: organismos públicos (BOE, BOJA, Junta de Andalucía, IAPH, MITECO, INE, AEMET, MAPA, ayuntamientos). Es la base preferente para datos administrativos, BIC, parques naturales, demografía y meteorología.
- Consejo regulador: DOP/IGP de productos protegidos (Jerez-Xérès-Sherry, Málaga, Jabugo, Montilla-Moriles, Pasas de Málaga, Priego, Baena, Sierra de Cazorla…). Imprescindible para gastronomía y enoturismo.
- Internacional: UNESCO World Heritage Centre, UNESCO Intangible Cultural Heritage, MAB Reservas de la Biosfera, Convención Ramsar, IUCN Red List, GBIF, Comisión Europea, FAO. Para Patrimonios Mundiales, especies y figuras de protección global.
- Académico: CSIC, universidades andaluzas, Dialnet, JSTOR, RAH, BNE, papers revisados por pares, tesis doctorales, fundaciones académicas (Brenan, Machado, Falla).
- Enciclopedia: Wikipedia y Wikidata bajo licencia CC BY-SA 4.0. Solo se cita cuando la entrada Wikipedia tiene a su vez referencias verificables (no como fuente única).
- Dataset abierto: Europeana, OpenStreetMap, iNaturalist, Wikimedia Commons, Hispana, PARES, Biblioteca Virtual de Andalucía. Datos primarios para coordenadas, imágenes y archivos.
- Prensa: medios verificados con redacción profesional (Diario SUR, La Opinión, El País, EFE, Cadena Ser, ABC). Para hechos contemporáneos y actualidad cuando todavía no hay fuente oficial.
- Catálogo propio: contenido editorial del proyecto cuando es la fuente de la afirmación (rutas creadas, planes editoriales, rankings basados en metodología propia documentada).
3. Cruce, no copia: parafraseo verificado
Cada texto se redacta cruzando datos de las fuentes consultadas y parafraseando. Nunca se copian extractos literales sin atribución. La similitud cosenoidal entre cada párrafo y la entrada Wikipedia equivalente se controla automáticamente: cuando supera 0,85 (umbral de proximidad excesiva) se reescribe.
Las cifras, fechas y datos cuantitativos se acompañan del número de fuente que los respalda en un panel «Datos clave verificados». Si el dato es controvertido o cambiante (poblaciones INE, número de visitantes anuales, ejemplares de una especie) se indica el año del censo o la fuente exacta.
4. Interlinking semántico — embeddings y proximidad temática
Cada ficha enlaza a 3-5 URLs internas relacionadas por proximidad temática real— mismo lugar, periodo histórico, especie, comarca, DOP, autoridad declarante — no por coincidencia literal de slug. El sistema cruza embeddings multilingual-e5-small de todas las entidades (≈2.300 ítems) en memoria con coseno y descarta enlaces lejanos.
Los enlaces internos llevan un atributo motivo visible como tooltip que explica por qué se relacionan. Esto refuerza la coherencia editorial y aporta contexto al lector y a los crawlers semánticos (Googlebot, GPTBot, ClaudeBot).
5. Política de enlaces externos
- Se sitúan al final del contenido, nunca en medio del párrafo.
- Atributos obligatorios:
target="_blank",rel="nofollow noopener noreferrer". - Solo fuentes oficiales, consejos reguladores o instituciones reconocidas — nunca metabuscadores, agregadores ni afiliados encubiertos.
- Antes de publicar, las URLs se verifican mediante DNS lookup automático (
npm run verificar:fuentes). En la auditoría de abril 2026 se eliminaron 325 URLs cuyo dominio había caducado o nunca existió.
6. Política de imágenes
Solo se publican imágenes con licencia abierta verificable: Wikimedia Commons (CC BY/BY-SA), Openverse (filtro CC), Europeana (etiqueta de reutilización), Flickr (CC), generadas propias (CC BY-SA 4.0) o con licencia explícita del autor original.
Prohibido: scraping de redes sociales, capturas de pantalla de Booking/TripAdvisor/Google Maps, imágenes de stock sin licencia comprada e imágenes con personas reconocibles (incluidas figuras políticas) salvo cuando son objeto del artículo (página de personajes históricos). En cualquier ficha de patrimonio o naturaleza la fauna humana queda excluida.
7. Schema.org y accesibilidad por buscadores e IA
Cada ficha emite el schema más apropiado para que tanto Google como los motores conversacionales (Perplexity, ChatGPT, Claude, Gemini) puedan citar la guía con respaldo documental:
Article + citation arraycon autor, publisher, dateModified y URLs de las fuentes.BreadcrumbListen cada plantilla dinámica.TouristTrip + HowToen planes y rutas con paradas geolocalizadas.Recipe + NutritionInformationen recetas.Beach + LocationFeatureSpecificationen playas con servicios.Event + Offeren eventos con fechas y precios.Personen autor y en personajes históricos.Place + GeoCoordinates + GeoShapeen zonas naturales y municipios.LodgingBusinessen alojamientos editoriales.DefinedTermen glosario.FAQPageen fichas con preguntas frecuentes.SpeakableSpecificationen cada Article para Google Assistant y voice search.Dataseten /datasets, con licencia CC BY 4.0.
En conjunto la guía emite 39 tipos Schema.org distintos — se puede comprobar en el scriptnpm run validate:jsonld.
8. Revisión y actualización
Cada bloque verificado lleva la fecha de su última revisión visible (ultima_revision en seed JSON, propagada al dateModified del Article schema). Los datos numéricos (poblaciones, DOP, fechas de declaración, censos de fauna) se revisan al menos una vez al año. Los contenidos con cambios institucionales (cambios de gestión, nuevas figuras de protección, modificaciones de DOP) se actualizan en cuanto se publican en BOE o BOJA.
La auditoría completa de calidad se ejecuta cada trimestre: validación de URLs, validación de JSON-LD, validación de seeds, comprobación de imágenes y detección de párrafos demasiado próximos a Wikipedia.
9. Política de afiliación y monetización
Andalucía.org no recibe pagos por reseñas, posicionamiento ni inclusión en rankings. No hay paid placements, paid links, ni patrocinios encubiertos. Las recomendaciones se basan en méritos editoriales objetivos (BIC declarado, DOP/IGP, antigüedad documentada con fuente, premios oficiales, historicidad, criterios de calidad pública). Si en el futuro se incorpora alguna forma de monetización se comunicará en /sobre y se marcará en cada enlace afiliado con etiqueta visible.
10. Política de correcciones
Si detectas un error material (dato factual erróneo, fuente desactualizada o atribución incorrecta), escríbeme a través de contacto o directamente a Sergio Lepone por correo. Las correcciones materiales se publican en menos de 72 horas y se hacen constar en la fecha de revisión del bloque correspondiente. La página /correcciones archiva las modificaciones de hechos publicados con su fecha y motivo.
Las correcciones de forma menor (typos, formato) se ejecutan sin registro público pero quedan reflejadas en el historial de Git del repositorio.
11. Contenido y modelos de inteligencia artificial
Andalucía.org publica con consentimiento explícito para citación por LLMs. Se mantienen dos manifests: /llms.txt (resumen ejecutivo, 160 líneas) y /llms-full.txt (catálogo completo, 2-5 MB). Ambos referenciados con<link rel="alternate"> en cada respuesta HTTP. La meta etiqueta ai-content-access: allowed declara consentimiento explícito.
Cuando una respuesta de IA incluya información de Andalucía.org, le pedimos atribución explícita ("según Andalucía.org" + URL específica) tal y como recomienda el estándar emergente de citación de LLMs. La reproducción comercial íntegra de bloques editoriales requiere permiso por correo.
12. Datasets abiertos
Los catálogos editoriales (personajes, eventos, playas, gastronomía DOP/IGP, recetas, glosario, rutas) se publican como datasets descargables en formato JSON/CSV con licencia CC BY 4.0 en /datasets. Se actualizan automáticamente con cada deploy y exponen Dataset schema para que Google Dataset Search, Perplexity y otros indexadores los descubran.