Me están Duplicando el contenido, ¿como hace un buscador para darse cuenta?

Con tanto contenido de calidad dando vueltas por la red, es inevitable que los robots de los motores de búsqueda encuentren notas, artículos, frases y demás contenido duplicado. La pregunta del millón es: ¿Cómo sabe un buscador qué páginas tienen contenido duplicado?