Marco Riani, Professor of Statistics

      Univ. of Parma (ITALY)

CORSO DI DATA MINING PER IL MARKETING


 

Appello maggio 2016:  testo e soluzione.

Appello giugno 2016 I: testo e soluzione

Appello giugno 2016 II: testo e soluzione

 


 

 

ESERCITAZIONI aggiuntive

 

TEST1

TEST2

TEST3

TEST4

TEST 5

TEST 6

 

 

TEST1 soluzione

TEST2 soluzione

TEST3 soluzione

TEST 4 soluzione

TEST 5 soluzione

TEST 6 soluzione

 

 

SYLLABUS

 

LIBRI DI TESTO

Zani S. e Cerioli A. (2007). Analisi dei dati e data mining per le decisioni aziendali, Giuffrè editore, Milano (capitolo XI)

 

M. Riani, F. Laurini e G. Morelli: Strumenti statistici e informatici per applicazioni aziendali, Pitagora Editrice, Bologna, 2013 Þ Capitoli 3 – 6 + Esercizi e Appendici.

 

A. Cerioli e F. Laurini: Il modello di regressione logistica, Uni.Nova, Parma, 2013 (Tutto).

 


 

Programma del corso

Regressione lineare
Richiami su regr. semplice e inferenza statistica (v. corsi precedenti)
Estensione al caso di più variabili esplicative (applicazioni reali)
Stima e test sui coefficienti di regressione
Scelta del modello e previsioni

Regressione logistica
Estensione del modello più utilizzata nelle applicazioni di marketing e di data mining: previsione del comportamento del consumatore

Alberi di classificazione
Previsione del comportamento del consumatore Conoscenza dei differenti algoritmi disponibili e stima tasso di errore Segmentazione della clientela

 


 

Lucidi delle lezioni

Prima settimana (regressione semplice con approccio descrittivo)


Seconda settimana (regressione semplice con approccio inferenziale)


Terza settimana (introduzione alla regressione lineare multipla)


Quarta settimana (regressione multipla tradizionale e robusta)


Quinta settimana (lucidi formato pdf)   (lucidi formato pptx)


Sesta settimana (lucidi formato pdf)   (lucidi formato pptx)


Settima e ottava settimana  (lucidi formato pptx)


Nona e decima settimana Lucidi in formato .pdf


 

 

SOFTWARE utilizzato durante il corso

Excel (2007 - 2016) e SPSS (21-23).

 

 

COMPONENTI AGGIUNTIVI DI EXCEL DA SCARICARE

ChartLabeler. Consente di aggiungere etichette personalizzate ai punti in un diagramma di dispersione.   

 


Per le istruzioni dettagliate sull'installazione dei componenti aggiuntivi è possibile scaricare il file Installazione_componenti_aggiuntivi.pdf


 

FILE DI CORREDO AL CORSO


File di integrazione.

Prima settimana

Argomento Obiettivo File di input File di output Data ultima modifica
Regressione semplice in ottica descrittiva Mostrare il procedimento di calcolo della stima dei parametri della retta di regressione. Calcolare i valori previsti, i residui e gli indici di bontà di adattamento. regr1

oppure

regr1 (con suggerimenti)

regr1(out) 11/02/2016

Seconda settimana 

Argomento Obiettivo File di input File di output Data ultima modifica
Regressione semplice in ottica inferenziale Imparare a calcolare intervalli di confidenza e sottoporre a verifica test i parametri del modello di regressione. Calcolare un intervallo di confidenza per i valori previsti regr-inf regr-inf(out) 18/02/2016


Approfondimento sulla v.c. Normale (standardizzata)
Argomento Obiettivo File di input File di output
v.c. normale (standardizzata) Imparare a calcolare in una v.a. normale la funzione di densità e la funzione di ripartizione. Trovare i valori che lasciano alla destra (sinistra) una probabilità prefissata. Calcolare la probabilità di ottenere valori compresi in un determinato intervallo norm norm(out)

Terza settimana 
Argomento Obiettivo File di input File di output Data ultima modifica
Sistemi lineari Scrivere i sistemi lineari in maniera matriciale e risolverli in maniera matriciale sistemi_lineari sistemi_lineari(out) 26/02/2016
Regressione multipla Calcolare i parametri del modello di regressione lineare multiplo utilizzando le matrici. Calcolare intervalli di confidenza e test semplici di verifica di ipotesi. Calcolare intervalli di confidenza dei valori previsti. regrmult regrmult(out) 24/02/2016


Quarta settimana 
 

Argomento Obiettivo File di input File di output Data ultima modifica
Regressione multipla Approfondire l'interpretazione della stima dei parametri nel modello di regressione lineare multiplo. Introdurre la correlazione parziale regrmult0 regrmult0(out) 24/02/2016
Modello di regressione Generare i dati in un modello di regressione e analizzare la variabità delle stime campionarie

regressione.xlsx regressione(out).xls

03/03/2016

Confronto tra i diversi metodi di stima


Argomento Obiettivo File di input File di output Data ultima modifica
Regressione robusta Imparare a stimare i parametri del modello di regressione utilizzando condizioni di accostamento diverse dalla somma dei quadrati dei residui. Introdurre stimatori dei parametri che non risentono della presenza di valori anomali regrrobust regrrobust(out) 03/03/2016


Quinta settimana 

Argomento Obiettivo File di input File di output Data ultima modifica
Regressione multipla Introdurre test di verifica d'ipotesi su combinazioni lineari dei coefficienti. regrtest regrtest(out) 10/03/2016

Sesta settimana 

Argomento Obiettivo File di input File di output Data ultima modifica
Regressione multipla Regressione con variabili dummy regrdummy regrdummy(out) 10/03/2016
Regressione multipla Consolidare i concetti appresi finora. (Risolvere tutti i quesiti ad eccezione del 5) esame2 esame2(out) 17/03/2016


Settima settimana

Argomento Obiettivo File di input File di output Data ultima modifica
Regressione multipla Destagionalizzare e detrendizzare una serie storica. Testare la presenza del trend e della stagionalità in una serie storica. Testare la presenza di autocorrelazione nei residui. Destagionalizzare con il vincolo di somma a zero dei coefficienti stagionali. Introdurre il test di autocorrelazione dei residui regrseaso regrseaso(out) 31/03/2016
Regressione multipla Introdurre il test per la verifica dell'ipotesi di omoschedasticità dei residui regretero regretero(out) 31/03/2016
Regressione multipla Modellare la presenza di eteroschedasticità. Ottenere stime GLS e confrontare le previsioni nel modello omoscehdastico con quelle del modello eteroschedastico EteroModel EteroModel(out) 07/04/2016


Ottava settimana
Argomento Obiettivo File di input File di output Data ultima modifica
Regressione multipla Riepilogare gli argomenti trattati finora riepilogo riepilogo(out) 21/04/2016
Regressione multipla Consolidare i concetti appresi finora. esame2 esame2(out) 17/03/2016



Argomento Obiettivo File di input File di output Data ultima modifica
v.c. logistica  Prendere confidenza con la v.c. logistica logistica.xlsx logistica(out).xlsx 14/04/2016
Regressione logistica Stimare i parametri tramite il risolutore oppure macro VBA Regr_logistica
_Macro_e_Ris.xlsm
Regr_logistica_
Macro_e_Ris
(out).xlsm
20/04/2016
Trovare le soluzioni di un'equazione tramite algoritmi iterativi Capire il funzionamento dell'algoritmo di Newton Raphson newton_raphson
_esempio.xlsx
newton_raphson
_esempio(out).xlsx
14/04/2016
Regressione logistica Capire come funzione l'algoritmo iterativo di stima dei parametri Regrlogistica
_Iter.xlsm
Regrlogistica
_Iter(out).xlsm
20/04/2016
Regressione logistica Calcolare una banda di confidenza del logit Regr_logistica
_logitINT.xlsx
Regr_logistica
_logitINT
(out).xlsx
20/04/2016
Regressione logistica Aspetti inferenziali e bontà di adattamento Regrlogistica
_Inf.xlsm
Regrlogistica_Inf(out).xlsm 20/04/2016
Regressione logistica Test di bontà di adattamento di Homer e regrlogistica
_testHL.xlsx
regrlogistica
_testHL(out).xlsx
20/04/2016
Regressione logistica Calcolare la curva ROC regrlogistica
_ROC.xlsx
regrlogistica
_ROC(out).xlsx
20/04/2016


  
  

Esercizio che simula una prova di esame
Argomento Obiettivo File di input File di output Data ultima modifica
Esame Ripasso degli argomenti trattati esame1 esame1(out) 10/03/2016