Finder repozytoriów GitHub
Napisałem narzędzie konsolowe w Pythonie do wyszukiwania repozytoriów GitHub na podstawie opisu semantycznego. Program rozwiązuje prosty problem — standardowe wyszukiwanie GitHub szuka tylko po dokładnych słowach w tytule, a to narzędzie rozumie sens zapytania.
Użytkownik wprowadza krótki opis w 2–3 słowach, na przykład "wizualizacja danych" lub "bot telegramowy", a program samodzielnie znajduje najbardziej odpowiednie repozytoria. W tle działają algorytmy TF-IDF i Cosine Similarity — przekształcają tekst w wektory liczbowe i porównują je ze sobą.
Projekt napisany jest w czystym Pythonie bez zewnętrznych bibliotek. Kod jest podzielony na moduły z podziałem odpowiedzialności: oddzielny plik dla algorytmów, do pracy z API, do obsługi błędów z zapisem logów. Token GitHub jest opcjonalny — bez niego działa, z nim szybciej.
Użytkownik wprowadza krótki opis w 2–3 słowach, na przykład "wizualizacja danych" lub "bot telegramowy", a program samodzielnie znajduje najbardziej odpowiednie repozytoria. W tle działają algorytmy TF-IDF i Cosine Similarity — przekształcają tekst w wektory liczbowe i porównują je ze sobą.
Projekt napisany jest w czystym Pythonie bez zewnętrznych bibliotek. Kod jest podzielony na moduły z podziałem odpowiedzialności: oddzielny plik dla algorytmów, do pracy z API, do obsługi błędów z zapisem logów. Token GitHub jest opcjonalny — bez niego działa, z nim szybciej.