Hierfür gibt es zwei verschiedene Möglichkeiten:
Beide Methoden haben ihre Tücken: Wer die Wörter im Quellcode zählen will, muss beachten, dass keine Kommandostrukturen (z.B. Präambel, Formatangaben) oder auskommentierten Absätze mitgezählt werden. Fertig kompilierte Dokumente enthalten dagegen ggf. sich wiederholende Kopfzeilen mit der Kapitelüberschrift oder Seitenzahlen, die ja für eine realistische Wortanzahl eigentlich auch nicht mitgezählt werden sollten. Manchmal werden auch am Zeilenende umgebrochene Wörter als 2 Wörter gezählt oder gar nicht, wenn sie eine komplexe Ligatur-Glyphe enthalten. All das verfälscht die korrekte Anzahl der Wörter.
Am sinnvollsten ist es, den reinen Quelltext zu zählen. Man muss nur ein Programm benutzen, dass die Kommandostrukturen und Kommentare nicht mit in die Zählung einbezieht.
Das geht über verschiedene Wege, ich stelle hier einige vor.
Manchmal ist es erforderlich, in einem PDF die Wörter zu zählen, z.B. wenn man nicht über den Quellcode verfügt.
Die zurückgegebene Wortanzahl liegt aber meistens nicht sehr nah an der Realität, weil Seitenzahlen, umgebrochene Wörter und andere Dinge mitgezählt werden.
Je nach Methode weicht die am Ende ausgerechnete Wortanzahl erheblich voneinander an (siehe Grafik). Für diesen Vergleich wurden außerdem zwei weitere Methoden aufgenommen:
Links eine kleine Grafik zur Wortzählung nach verschiedenen Methoden. Als Text habe ich eine meiner Kurzgeschichten verwendet. Die Methode "LibreOffice Writer" ist die Zählmethode des Textes nach LO Writer-interner Zählstatistik (keine Präambel oder Befehle, aber Kommentare). Die 2. Zählmethode "Kile" ist mit dem Kile-internen Wortzählalgorithmus des ursprünglichen Quelltextes gezählt worden (keine Kommandos, ohne Kommentare?). Bei Methode 3 ("Datei") wurde der Inhalt der vollständigen .tex-Datei über die Kommandozeile gezählt (also auch Wörter der Kommandostruktur, Präambel usw.). Bei Methode 4 ("PDF") wurde das fertige PDF wieder in eine Textdatei zerlegt und diese, wie eine Methode vorher beschrieben, gezählt. Obwohl das PDF weder Präambel noch Kommentare noch LaTeX-Kommandos enthält, ist die Wortanzahl identisch mit dem reinen Quelltext. Methode 5 ("texcount") zeigt das wahrscheinlich realistischste Ergebnis an. Der Unterschied zwischen Methode "LO Writer" und "Kile" ist eigenartig. Da im Writer nur reiner Text ohne Kommandos steht, hätte ich hier eine kleinere Wortanzahl als bei der Quelltext-Zählung durch Kile erwartet. Der Unterschied ist möglicherweise Resultat dessen, dass im Kile auch die auskommentierten Bereiche nicht mitgezählt werden, beim LO Writer aber schon.
Letztendlich empfehle ich die Quellcode-Zählung mit texcount.