Oggetto :Analisi dei dati
Argomento :Analisi del sentiment delle recensioni dei prodotti
Obiettivo :l'obiettivo di questo compito è eseguire l'analisi del sentiment sulle recensioni dei prodotti per determinare il sentimento del recensore nei confronti del prodotto.
Istruzioni :
1. Preparazione dei dati :
- Raccogliere un set di dati di recensioni di prodotti da una fonte appropriata (ad esempio Amazon, Yelp).
- Pulisci i dati rimuovendo le recensioni duplicate, gestendo i valori mancanti e convertendo il testo in minuscolo.
2. Analisi esplorativa dei dati :
- Esplorare i dati per comprenderne le caratteristiche e la distribuzione.
- Eseguire statistiche di base, come conteggi di frequenza e nuvole di parole, per identificare parole e frasi comuni utilizzate nelle recensioni.
3. Analisi del sentiment :
- Utilizzare una libreria o uno strumento di analisi del sentiment adeguato (ad esempio TextBlob, VADER o spaCy) per assegnare punteggi del sentiment a ciascuna recensione.
- Raggruppare le recensioni in categorie positive, negative o neutre in base ai punteggi relativi al sentiment.
4. Ingegneria delle funzionalità :
- Estrai caratteristiche rilevanti dalle recensioni che potrebbero contribuire al sentiment. Questi potrebbero includere frequenze di parole, segni di punteggiatura o altre funzionalità relative alla PNL.
5. Modello di apprendimento automatico :
- Sviluppare un modello di apprendimento automatico supervisionato per classificare le recensioni come positive o negative.
- Addestrare il modello sui dati etichettati e valutarne le prestazioni utilizzando metriche appropriate (ad esempio, accuratezza, precisione, richiamo e punteggio F1).
6. Interpretazione del modello :
- Visualizza le previsioni del modello utilizzando matrici di confusione o altre visualizzazioni pertinenti.
- Analizzare le recensioni erroneamente classificate per identificare le aree di miglioramento.
7. Rapporti :
- Scrivere un report che riassuma i risultati dell'analisi del sentiment.
- Includere dettagli sulla preparazione dei dati, sull'analisi esplorativa dei dati, sull'ingegneria delle funzionalità, sulla formazione del modello e sui risultati della valutazione.
Invio :
- Invia quanto segue:
- Un Jupyter Notebook o uno script Python contenente il codice e l'analisi.
- Un rapporto PDF che riassume i risultati.
Scadenza :
- L'incarico scade il [data].
- L'invio tardivo comporterà una penalità del 10% al giorno.