On the futility of trying to catch bots

Meanwhile, back in DuoPixel, Mark argues on the futility of using captchas as a method to distinguish bots from humans, and that they should be used only after other methods have been tried, because they’re annoying and people, unlike bots, get pissed.

However, he still misses the point on captchas and why use them at all: that the fact that the comments are written by a human or a machine is irrelevant, what’s important is the content and what it adds to the conversation.

It’s easy and cheap to get humans to do the dirty jobs that bots are unable to do just yet, but as Watson recently showed in Jeopardy, it’s just a matter of time before bots can get through any kind of practical test you can implement in your blog or website to keep them out.

And besides, it doesn’t matter. The important thing is to keep empty, spammy content out, and that’s easier to recognize by looking at keywords and phrases. After all, for humans to respond it has to be worded a certain way.

Bots can do more than just leave spammy content. They can read your blog post, tell what it’s about and produce a relevant and helpful comment. Sure, it may link back to some site trying to sell you something, but that’s what we humans do and it’s an accepted practice that as long as the comment is relevant and valuable in itself it can link back.

And if you have a bot of your own watching over the comments and producing smart answers of their own, you can have a conversation. Who said the net was only for humans?

Anyway, captchas are useless not because they can be beat, but because they focus on something irrelevant.

In the words of Ken Jennings: I for one welcome our new computer overlords.

Búsqueda por idiomas y reportar spam en Twitter

¡Ah, el spam! No podemos vivir con él, pero tampoco sin él. Hmmm… un momento ¡sí podemos vivir sin él! De hecho es lo que tratamos de hacer pero no resulta nada fácil. Cualquier cosa que empieza a cobrar popularidad como medio de comunicación ¡pum! llegan los espamers a anunciar sus productos no solicitados, generalmente tetas, viagra o maneras fáciles de hacer dinero. A veces también virus o fraudes para sacarte dinero.

Twitter ha sido especialmente atosigado por el spam ya desde hace algunos meses y puso una cuenta que se llama @spam para reportar a quienes se pasan de la raya. A partir de hoy añadieron también una opción para reportar una cuenta desde la página del sitio directamente, así que basta con picarle para que la cuenta quede reportada. No creas que con esto te puedes deshacer de alguien que te cae gordo, la gente de Twitter investigará primero si realmente es una cuenta espamera.

La cuenta de spam con la nueva opción para reportar spam

No sé si hayan implementado esta opción también a nivel del API para que aplicaciones de terceros como Tweetdeck y Tweetie puedan poner un botón para reportes, pero por algo se empieza. Aunque, por otra parte, las cuentas de espamers son relativamente fáciles de reconocer y mi estrategia es simplemente ignorarlos. Ni siquiera los bloqueo como seguidores, como no me importa cuantas me sigan, pues me da igual.

En otras noticias, en el sitio de búsquedas de tweets han hecho varios cambios. Ahora han implementado una opción para filtrar los tweets por idiomas, así que si quieres encontrar los tweets que digan “futbol” en español puedes hacerlo directamente desde ahí. Esto hace a ese sitio mucho más útil, ya que ver tweets en idiomas que no entendemos nos dificulta bastante encontrar el resultado que deseamos. También tiene la opción de traducir al inglés desde unos cuantos idiomas, cosa que hace con regulares resultados y crear un feed de rss con los resultados para poder leerlos desde prácticamente cualquier lado.

Búsquedas en Twitter en varios idiomas

¿Cuál es tu estrategia contra el spam en Twitter? ¿Usarás las nuevas funciones del sitio de búsquedas?