スパムの文章は意図的に不自然にする戦略も一般的なものだと聞いたことがあります。 スパムの目的として最終的になんらかの形で「騙す」ということを考えると、あからさまに不自然な文章にすら釣られてしまう騙されやすい人を選別したほうが良いからです。 最初の段階だけ騙せても後の工程で離脱されてはスパムの目的がはたせないので最初の段階は選別であると割り切った戦略です。
こういった種類のスパムはほとんどの人にとっては邪魔であることが迷惑なのであって騙されたという形で迷惑を被る人は稀です。 それがスパムだと判断できる大多数の人が通報して運営が最終判断して削除するというのは原始的ですが確実です。 通報窓口は用意すべきでしょう。
もちろん前提としてはスパム投稿しづらい仕組みを構築した上で、それでも難しい部分についてということになりますが。
何もかもを自動化で対処しようとするとどうしても多少の誤爆 (スパムでないものをスパム判定する) の懸念はありますし、投稿された記事を安易に削除しないというのもサイト運用の誠実さのひとつだと思います。
こういった判断については偽陽性・偽陰性についてどのような方針を持つかの問題です。
たとえばウェブ検索なら一般論としては検索キーワードに対して的確にマッチするかどうか判断しづらいものは結果から除外してしまったほうがユーザ体験は良いです。 普通のユーザはウェブ全体を網羅的に調べる気はないので判断が確かなものだけで十分だからです。
ユーザ投稿型のサービスでのスパム判定は判断しづらいものをどんどん削除するようでは問題でしょう。 誤爆を少なくするかわりにスパムが少し見えてしまうのはある程度は仕方のない部分だと思います。
Qiita について言うなら、バースト的に大量のスパム記事が溢れることがありますが大抵の場合に数日程度で解消されているようですし、毎日最新投稿を見ないと仕事が滞るような性質のものでもないのでこれくらいの対処で上手くいっていると言って良いんじゃないですかね……というのが私の感想です。