En estos días tenía una db de email en donde tenía que validar estructura de direcciones estuvieran bien y a la vez que el dominio existiera, sin validar si user está activo en dicho servidor de correo. Por ejemplo:
usuario @gmail.con
Este email está mal escrito porque se debe marcar dicho email para tratar de arreglar manualmente a usuario@dominio, ahora también hay que validar si dominio gmail.con existe, de no existir se trata de corregir o se elimina email.
Manualmente, debería quedar así: [email protected]
Ahora bien, buscando código anteriormente en google o cualquier buscador, uno facilmente se demoraba 1día o 2 buscando código, adaptando y haciendo pruebas.
Esta vez quisimos probar ChatGPT o Bard, explicándole que necesitábamos y en el lenguaje que debíamos usar. Ahora con estas herramientas se ahorra uno cantidad de tiempo y código reutilizado … Ah, esto es para cosas buenas, pero ni imaginar para lo malo que se puede usar.
Le preguntamos al AI lo siguiente:
I need create a python 3.12 script, to validate emails is validate address and if exist with best library on python. Also I have .csv with header (info, first name, last name, email), I need import and review line by line. If possible enable this process with 10 threads or config more threard. Export file .csv with email and info if it’s ok or some error on column
*Solo modificamos code para agregar «time elapsed», para saber cuando demoró el proceso
Un ejemplo de .csv
Software Utilizado y comandos.
- Python 3.12 – https://www.python.org/ftp/python/3.12.0/python-3.12.0-amd64.exe – Instalar en win7+, mi conf es win11 instalado en c:\python312\, custom install
- En powershell ir a CD c:\python312\, luego instalar librerias – pip install email-validator pandas
- En powershell en misma folder colocar validate-email.py y input.csv y ejecutar: python validate-email.py C:\python312\input.csv C:\python312\output.csv
- Revisar archivo de salida en C:\python312
Deja una respuesta