Proiect dedicat pipeline-urilor de crawling și procesare masivă de date.
Ce vei face:
- Scraping scalable în Java
- Procesare text / deduplicare / matching
- Microservicii
- Optimizare performanță
Cerem:
- Java (Spring sau similar)
- Experiență cu crawling / async tasks / queue systems
- MySQL / PostgreSQL
Bonus:
- Kafka / RabbitMQ
- ElasticSearch