Quelques champs contiennent des mots, ou des expressions spécifiques, ce qui signifie que si l'on peut détecter de tels mots ou expressions, on peut être quasiment sûr du nom du champ contenant cette expression ou ce(s) mot(s). Mais cette certitude n'est que partielle, car le champ title est susceptible de contenir n'importe quelle chaîne de caractère (une année, un sigle, ...), et qu'il existe toujours des cas imprévus pour lesquels une expression a priori discriminante peut se trouver dans un autre champ.
Les champs pour lesquels les contraintes lexicales sont les plus utiles sont :