diff --git a/rule.ipynb b/rule.ipynb
index 0e2938c..4402a92 100644
--- a/rule.ipynb
+++ b/rule.ipynb
@@ -36,7 +36,7 @@
},
{
"cell_type": "code",
- "execution_count": 2,
+ "execution_count": 142,
"id": "310c031d",
"metadata": {},
"outputs": [],
@@ -47,19 +47,19 @@
},
{
"cell_type": "code",
- "execution_count": 3,
+ "execution_count": 143,
"id": "cc6821d0",
"metadata": {},
"outputs": [],
"source": [
- "df = pd.read_excel(\"training-nltk-mapping3.xlsx\")\n",
+ "df = pd.read_excel(\"training-ner-mapping3.xlsx\")\n",
"cnt = df.groupby(\"CASISTICA_MOTIVAZIONE\").count() \\\n",
".rename(columns={\"Unnamed: 0\": \"count\"})[\"count\"]"
]
},
{
"cell_type": "code",
- "execution_count": null,
+ "execution_count": 4,
"id": "4b8cbd26",
"metadata": {},
"outputs": [],
@@ -75,7 +75,7 @@
},
{
"cell_type": "code",
- "execution_count": 11,
+ "execution_count": 5,
"id": "3903d9da",
"metadata": {},
"outputs": [],
@@ -92,7 +92,7 @@
},
{
"cell_type": "code",
- "execution_count": null,
+ "execution_count": 194,
"id": "c0d08201",
"metadata": {},
"outputs": [
@@ -100,7 +100,13 @@
"name": "stderr",
"output_type": "stream",
"text": [
- "C:\\Users\\a.torchi\\AppData\\Local\\Temp\\ipykernel_31116\\2333237563.py:5: SettingWithCopyWarning: \n",
+ "C:\\Users\\a.torchi\\AppData\\Local\\Temp\\ipykernel_21580\\3455914512.py:3: SettingWithCopyWarning: \n",
+ "A value is trying to be set on a copy of a slice from a DataFrame.\n",
+ "Try using .loc[row_indexer,col_indexer] = value instead\n",
+ "\n",
+ "See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy\n",
+ " df_cp['NOTE_OPERATORE'] = df_cp['NOTE_OPERATORE'].apply(str)\n",
+ "C:\\Users\\a.torchi\\AppData\\Local\\Temp\\ipykernel_21580\\3455914512.py:6: SettingWithCopyWarning: \n",
"A value is trying to be set on a copy of a slice from a DataFrame.\n",
"Try using .loc[row_indexer,col_indexer] = value instead\n",
"\n",
@@ -130,7 +136,7 @@
"
\n",
" \n",
- " | 2627 | \n",
+ " 119 | \n",
" Generica | \n",
- " (mai, stato, proprietario) | \n",
- " 11 | \n",
- " Periodo diverso | \n",
- " 2 | \n",
- " 3 | \n",
- " 3.666667 | \n",
- "
\n",
- " \n",
- " | 2626 | \n",
- " Generica | \n",
- " (mai, stato, proprietario) | \n",
- " 11 | \n",
- " No esenzione PH | \n",
- " 1 | \n",
- " 3 | \n",
- " 3.666667 | \n",
- "
\n",
- " \n",
- " | 2625 | \n",
- " Periodo diverso | \n",
- " (manca, vers, allega) | \n",
- " 11 | \n",
- " Generica | \n",
- " 3 | \n",
- " 3 | \n",
- " 3.666667 | \n",
- "
\n",
- " \n",
- " | 2587 | \n",
- " Furto non annotato | \n",
- " (annotata, pra, già) | \n",
- " 8 | \n",
- " Esportazione non annotata | \n",
- " 1 | \n",
- " 2 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2588 | \n",
- " Furto non annotato | \n",
- " (annotata, pra, già) | \n",
- " 8 | \n",
- " Generica | \n",
- " 1 | \n",
- " 2 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2386 | \n",
- " Periodo diverso | \n",
- " (periodo, tributario, versamento) | \n",
- " 4 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2335 | \n",
- " Regione diversa | \n",
- " (versamento, favore, regione) | \n",
- " 4 | \n",
- " Periodo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2347 | \n",
- " Furto non annotato | \n",
- " (furto, allega, denuncia) | \n",
- " 4 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2356 | \n",
- " Vendita tardiva | \n",
- " (vendita, bollo, dovuto) | \n",
- " 4 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2384 | \n",
- " Periodo diverso | \n",
- " (versamento, allegato, relativo) | \n",
- " 4 | \n",
- " Vendita tardiva | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2379 | \n",
- " Vendita tardiva | \n",
- " (periodo, tributario, già) | \n",
- " 4 | \n",
- " Periodo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2345 | \n",
- " Furto non annotato | \n",
- " (denuncia, furto, mai) | \n",
- " 4 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2302 | \n",
- " Periodo diverso | \n",
- " (allega, bollo, pagato) | \n",
- " 4 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2340 | \n",
- " Generica | \n",
- " (presa, carico, demolitore) | \n",
- " 4 | \n",
- " Fermo | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2315 | \n",
- " No esenzione PH | \n",
- " (invalidità, idoneo, rilascio) | \n",
- " 4 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2295 | \n",
- " Periodo diverso | \n",
- " (non, presente, bollo) | \n",
- " 4 | \n",
- " Vendita tardiva | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2296 | \n",
- " Generica | \n",
- " (altra, regione, periodo) | \n",
- " 4 | \n",
- " Acquisto nel mese di rinnovo; concessionario | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2317 | \n",
- " Generica | \n",
- " (nessun, versamento, presente) | \n",
- " 4 | \n",
- " Periodo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2316 | \n",
- " Esenzione PH senza istanza | \n",
- " (presente, cliente, avvisato) | \n",
- " 4 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2336 | \n",
- " Periodo diverso | \n",
- " (non, presente, ricevuta) | \n",
- " 4 | \n",
- " Ricevuta non valida | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2355 | \n",
- " Generica | \n",
- " (domiciliazione, bancaria, attiva) | \n",
- " 4 | \n",
- " Domiciliazione tardiva | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2282 | \n",
- " Generica | \n",
- " (visura, pra, risulta) | \n",
- " 4 | \n",
- " Vendita tardiva | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2280 | \n",
- " Vendita tardiva | \n",
- " (veicolo, venduto, mese) | \n",
- " 4 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2273 | \n",
- " Generica | \n",
- " (bollo, dovuto, cliente) | \n",
- " 4 | \n",
- " Demolizione | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2277 | \n",
- " Generica | \n",
- " (perdita, possesso, trascritta) | \n",
- " 4 | \n",
- " Sequestro non annotato | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2330 | \n",
- " Regione diversa | \n",
- " (versamento, effettuato, favore) | \n",
- " 4 | \n",
- " Periodo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2383 | \n",
- " Vendita tardiva | \n",
- " (utile, atto, di) | \n",
- " 4 | \n",
- " Acquisto nel mese di rinnovo; privato | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2272 | \n",
- " Periodo diverso | \n",
- " (non, congruo, versamento) | \n",
- " 4 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2270 | \n",
- " Generica | \n",
- " (pratica, lavorata, nuovo) | \n",
- " 4 | \n",
- " Periodo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2309 | \n",
- " Generica | \n",
- " (veicolo, demolito, periodo) | \n",
- " 4 | \n",
- " Demolizione | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2279 | \n",
- " Generica | \n",
- " (targa, errata, targa) | \n",
- " 4 | \n",
- " Regione diversa | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2304 | \n",
- " Periodo diverso | \n",
- " (presente, allega, versamenti) | \n",
- " 4 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 4.000000 | \n",
- "
\n",
- " \n",
- " | 2645 | \n",
- " Vendita tardiva | \n",
- " (vendita, tardivo, veicolo) | \n",
- " 13 | \n",
- " Acquisto nel mese di rinnovo; concessionario | \n",
- " 1 | \n",
- " 3 | \n",
- " 4.333333 | \n",
- "
\n",
- " \n",
- " | 2646 | \n",
- " Vendita tardiva | \n",
- " (vendita, tardivo, veicolo) | \n",
- " 13 | \n",
- " Acquisto nel mese di rinnovo; privato | \n",
- " 2 | \n",
- " 3 | \n",
- " 4.333333 | \n",
- "
\n",
- " \n",
- " | 2607 | \n",
- " Generica | \n",
- " (veicolo, targato, targa) | \n",
- " 9 | \n",
- " No esenzione PH | \n",
- " 1 | \n",
- " 2 | \n",
- " 4.500000 | \n",
- "
\n",
- " \n",
- " | 2608 | \n",
- " Generica | \n",
- " (veicolo, targato, targa) | \n",
- " 9 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 2 | \n",
- " 4.500000 | \n",
- "
\n",
- " \n",
- " | 2463 | \n",
- " Periodo diverso | \n",
- " (regione, versamento, non) | \n",
- " 5 | \n",
- " Regione diversa | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2616 | \n",
- " Periodo diverso | \n",
- " (versamento, riferito, altra) | \n",
- " 10 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 2 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2615 | \n",
- " Periodo diverso | \n",
- " (versamento, riferito, altra) | \n",
- " 10 | \n",
- " Generica | \n",
- " 1 | \n",
- " 2 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2467 | \n",
- " Periodo diverso | \n",
- " (richiesta, versamento, non) | \n",
- " 5 | \n",
- " Esenzione PH senza istanza | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2462 | \n",
- " Generica | \n",
- " (atto, altra, regione) | \n",
- " 5 | \n",
- " Acquisto nel mese di rinnovo; privato | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2390 | \n",
- " Vendita tardiva | \n",
- " (bollo, dovuto, vendita) | \n",
- " 5 | \n",
- " Generica 2_non allegata documentazione | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2612 | \n",
- " Furto non annotato | \n",
- " (perdita, possesso, furto) | \n",
- " 10 | \n",
- " Rientro in possesso | \n",
- " 1 | \n",
- " 2 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2395 | \n",
- " Generica | \n",
- " (rientro, possesso, data) | \n",
- " 5 | \n",
- " Rientro in possesso | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2394 | \n",
- " Periodo diverso | \n",
- " (presente, aci/tabaccaio/agenzia, versamento) | \n",
- " 5 | \n",
- " Ricevuta non valida | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2476 | \n",
- " Periodo diverso | \n",
- " (allega, ricevuta, pagamento) | \n",
- " 5 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2448 | \n",
- " Generica | \n",
- " (dichiara, aver, pagato) | \n",
- " 5 | \n",
- " Vendita tardiva | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2446 | \n",
- " Generica | \n",
- " (disabile, fiscalmente, carico) | \n",
- " 5 | \n",
- " No esenzione PH | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2420 | \n",
- " Esenzione PH senza istanza | \n",
- " (disabile, respinta, manca) | \n",
- " 5 | \n",
- " No esenzione PH | \n",
- " 1 | \n",
- " 1 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2611 | \n",
- " Furto non annotato | \n",
- " (perdita, possesso, furto) | \n",
- " 10 | \n",
- " Generica | \n",
- " 1 | \n",
- " 2 | \n",
- " 5.000000 | \n",
- "
\n",
- " \n",
- " | 2662 | \n",
- " Generica | \n",
- " (cliente, dichiara, aver) | \n",
- " 16 | \n",
- " Vendita tardiva | \n",
- " 1 | \n",
- " 3 | \n",
- " 5.333333 | \n",
- "
\n",
- " \n",
- " | 2664 | \n",
- " Generica | \n",
- " (allega, carta, circolazione) | \n",
- " 16 | \n",
- " Esenzione PH senza istanza | \n",
- " 1 | \n",
- " 3 | \n",
- " 5.333333 | \n",
- "
\n",
- " \n",
- " | 2665 | \n",
- " Generica | \n",
- " (allega, carta, circolazione) | \n",
- " 16 | \n",
- " Esportazione non annotata | \n",
- " 1 | \n",
- " 3 | \n",
- " 5.333333 | \n",
- "
\n",
- " \n",
- " | 2666 | \n",
- " Generica | \n",
- " (allega, carta, circolazione) | \n",
- " 16 | \n",
- " Vendita tardiva | \n",
- " 1 | \n",
- " 3 | \n",
- " 5.333333 | \n",
- "
\n",
- " \n",
- " | 2663 | \n",
- " Generica | \n",
- " (cliente, dichiara, aver) | \n",
- " 16 | \n",
- " Esportazione non annotata | \n",
- " 2 | \n",
- " 3 | \n",
- " 5.333333 | \n",
- "
\n",
- " \n",
- " | 2635 | \n",
- " Periodo diverso | \n",
- " (non, presente, versamento) | \n",
- " 11 | \n",
- " Regione diversa | \n",
- " 1 | \n",
- " 2 | \n",
- " 5.500000 | \n",
- "
\n",
- " \n",
- " | 2636 | \n",
- " Periodo diverso | \n",
- " (non, presente, versamento) | \n",
- " 11 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 2 | \n",
- " 5.500000 | \n",
- "
\n",
- " \n",
- " | 2483 | \n",
- " Generica | \n",
- " (documentazione, allegata, targa) | \n",
- " 6 | \n",
- " Periodo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2639 | \n",
- " Generica | \n",
- " (allega, certificato, storico) | \n",
- " 12 | \n",
- " Esenzione PH senza istanza | \n",
- " 2 | \n",
- " 2 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2534 | \n",
- " Periodo diverso | \n",
- " (x, periodo, tributario) | \n",
- " 6 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2512 | \n",
- " Periodo diverso | \n",
- " (versamento, allegato, anno) | \n",
- " 6 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2533 | \n",
- " Generica | \n",
- " (carta, circolazione, annotazione) | \n",
- " 6 | \n",
- " Esenzione PH senza istanza | \n",
- " 1 | \n",
- " 1 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2518 | \n",
- " Vendita tardiva | \n",
- " (pagamento, atto, di) | \n",
- " 6 | \n",
- " Acquisto nel mese di rinnovo; privato | \n",
- " 1 | \n",
- " 1 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2482 | \n",
- " Periodo diverso | \n",
- " (non, presente, allegato) | \n",
- " 6 | \n",
- " Esenzione PH senza istanza | \n",
- " 1 | \n",
- " 1 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2642 | \n",
- " Periodo diverso | \n",
- " (bollo, allegato, corrisponde) | \n",
- " 12 | \n",
- " Generica | \n",
- " 2 | \n",
- " 2 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2644 | \n",
- " Periodo diverso | \n",
- " (bollo, pagato, x) | \n",
- " 12 | \n",
- " Regione diversa | \n",
- " 1 | \n",
- " 2 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2643 | \n",
- " Periodo diverso | \n",
- " (bollo, pagato, x) | \n",
- " 12 | \n",
- " Generica | \n",
- " 1 | \n",
- " 2 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2479 | \n",
- " Periodo diverso | \n",
- " (allegato, anno, manca) | \n",
- " 6 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 6.000000 | \n",
- "
\n",
- " \n",
- " | 2652 | \n",
- " Generica | \n",
- " (atto, data, certa) | \n",
- " 13 | \n",
- " Furto non annotato | \n",
- " 1 | \n",
- " 2 | \n",
- " 6.500000 | \n",
- "
\n",
- " \n",
- " | 2651 | \n",
- " Generica | \n",
- " (atto, data, certa) | \n",
- " 13 | \n",
- " Esportazione non annotata | \n",
- " 1 | \n",
- " 2 | \n",
- " 6.500000 | \n",
- "
\n",
- " \n",
- " | 2683 | \n",
- " Periodo diverso | \n",
- " (presente, non, congruo) | \n",
- " 27 | \n",
- " Veicolo diverso | \n",
- " 3 | \n",
- " 4 | \n",
- " 6.750000 | \n",
- "
\n",
- " \n",
- " | 2680 | \n",
- " Periodo diverso | \n",
- " (versam, presente, non) | \n",
- " 27 | \n",
- " Versamento annullato | \n",
- " 1 | \n",
- " 4 | \n",
- " 6.750000 | \n",
- "
\n",
- " \n",
- " | 2682 | \n",
- " Periodo diverso | \n",
- " (presente, non, congruo) | \n",
- " 27 | \n",
- " Versamento annullato | \n",
- " 1 | \n",
- " 4 | \n",
- " 6.750000 | \n",
- "
\n",
- " \n",
- " | 2681 | \n",
- " Periodo diverso | \n",
- " (versam, presente, non) | \n",
- " 27 | \n",
- " Veicolo diverso | \n",
- " 3 | \n",
- " 4 | \n",
- " 6.750000 | \n",
- "
\n",
- " \n",
- " | 2737 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " Domiciliazione tardiva | \n",
- " 1 | \n",
- " 22 | \n",
- " 6.909091 | \n",
- "
\n",
- " \n",
- " | 2740 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " No minivoltura | \n",
- " 1 | \n",
- " 22 | \n",
- " 6.909091 | \n",
- "
\n",
- " \n",
- " | 2745 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " Acquisto nel mese di rinnovo; privato | \n",
+ " (carta, circolazione) | \n",
+ " 85 | \n",
" 7 | \n",
- " 22 | \n",
- " 6.909091 | \n",
+ " 115.136381 | \n",
"
\n",
" \n",
- " | 2744 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " Periodo diverso | \n",
- " 6 | \n",
- " 22 | \n",
- " 6.909091 | \n",
- "
\n",
- " \n",
- " | 2743 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " Demolizione | \n",
- " 2 | \n",
- " 22 | \n",
- " 6.909091 | \n",
- "
\n",
- " \n",
- " | 2739 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " Generica 2_non allegata documentazione | \n",
- " 1 | \n",
- " 22 | \n",
- " 6.909091 | \n",
- "
\n",
- " \n",
- " | 2738 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " Esportazione non annotata | \n",
- " 1 | \n",
- " 22 | \n",
- " 6.909091 | \n",
- "
\n",
- " \n",
- " | 2742 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " Acquisto nel mese di rinnovo; concessionario | \n",
- " 2 | \n",
- " 22 | \n",
- " 6.909091 | \n",
- "
\n",
- " \n",
- " | 2741 | \n",
- " Vendita tardiva | \n",
- " (atto, di, vendita) | \n",
- " 152 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 22 | \n",
- " 6.909091 | \n",
- "
\n",
- " \n",
- " | 2654 | \n",
- " Vendita tardiva | \n",
- " (dovuto, versamento, non) | \n",
- " 14 | \n",
- " Perdita possesso con DS successiva | \n",
- " 1 | \n",
- " 2 | \n",
- " 7.000000 | \n",
- "
\n",
- " \n",
- " | 2653 | \n",
- " Vendita tardiva | \n",
- " (dovuto, versamento, non) | \n",
- " 14 | \n",
- " Esportazione non annotata | \n",
- " 1 | \n",
- " 2 | \n",
- " 7.000000 | \n",
- "
\n",
- " \n",
- " | 2579 | \n",
+ " 120 | \n",
" Generica | \n",
- " (allega, presa, carico) | \n",
- " 7 | \n",
- " Fermo | \n",
- " 1 | \n",
- " 1 | \n",
- " 7.000000 | \n",
- "
\n",
- " \n",
- " | 2572 | \n",
- " Periodo diverso | \n",
- " (presente, allega, versamento) | \n",
- " 7 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 7.000000 | \n",
- "
\n",
- " \n",
- " | 2576 | \n",
- " Periodo diverso | \n",
- " (corrisponde, periodo, richiesto) | \n",
- " 7 | \n",
- " Regione diversa | \n",
- " 1 | \n",
- " 1 | \n",
- " 7.000000 | \n",
- "
\n",
- " \n",
- " | 2578 | \n",
- " Periodo diverso | \n",
- " (pagato, x, periodo) | \n",
- " 7 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 7.000000 | \n",
- "
\n",
- " \n",
- " | 2566 | \n",
- " Periodo diverso | \n",
- " (ricevuta, allegata, riferita) | \n",
- " 7 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 7.000000 | \n",
- "
\n",
- " \n",
- " | 2731 | \n",
- " Vendita tardiva | \n",
- " (di, vendita, tardivo) | \n",
- " 147 | \n",
- " Domiciliazione tardiva | \n",
- " 1 | \n",
+ " (iscrizione, asi) | \n",
" 19 | \n",
- " 7.736842 | \n",
- "
\n",
- " \n",
- " | 2733 | \n",
- " Vendita tardiva | \n",
- " (di, vendita, tardivo) | \n",
- " 147 | \n",
- " Veicolo diverso | \n",
" 1 | \n",
- " 19 | \n",
- " 7.736842 | \n",
+ " 52.075960 | \n",
"
\n",
" \n",
- " | 2732 | \n",
- " Vendita tardiva | \n",
- " (di, vendita, tardivo) | \n",
- " 147 | \n",
- " No minivoltura | \n",
- " 1 | \n",
- " 19 | \n",
- " 7.736842 | \n",
- "
\n",
- " \n",
- " | 2735 | \n",
- " Vendita tardiva | \n",
- " (di, vendita, tardivo) | \n",
- " 147 | \n",
- " Periodo diverso | \n",
- " 6 | \n",
- " 19 | \n",
- " 7.736842 | \n",
- "
\n",
- " \n",
- " | 2734 | \n",
- " Vendita tardiva | \n",
- " (di, vendita, tardivo) | \n",
- " 147 | \n",
- " Acquisto nel mese di rinnovo; concessionario | \n",
- " 2 | \n",
- " 19 | \n",
- " 7.736842 | \n",
- "
\n",
- " \n",
- " | 2736 | \n",
- " Vendita tardiva | \n",
- " (di, vendita, tardivo) | \n",
- " 147 | \n",
- " Acquisto nel mese di rinnovo; privato | \n",
- " 7 | \n",
- " 19 | \n",
- " 7.736842 | \n",
- "
\n",
- " \n",
- " | 2730 | \n",
- " Vendita tardiva | \n",
- " (di, vendita, tardivo) | \n",
- " 147 | \n",
- " Demolizione | \n",
- " 1 | \n",
- " 19 | \n",
- " 7.736842 | \n",
- "
\n",
- " \n",
- " | 2591 | \n",
- " Periodo diverso | \n",
- " (riferito, periodo, tributario) | \n",
- " 8 | \n",
+ " 121 | \n",
" Generica | \n",
+ " (codice, fiscale) | \n",
+ " 18 | \n",
" 1 | \n",
- " 1 | \n",
- " 8.000000 | \n",
+ " 49.335120 | \n",
"
\n",
" \n",
- " | 2589 | \n",
- " Fermo | \n",
- " (fermo, amministrativo, fermo) | \n",
- " 8 | \n",
+ " 122 | \n",
" Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 8.000000 | \n",
+ " (presa, carico) | \n",
+ " 23 | \n",
+ " 3 | \n",
+ " 47.096935 | \n",
"
\n",
" \n",
- " | 2583 | \n",
- " Furto non annotato | \n",
- " (furto, mai, trascritto) | \n",
- " 8 | \n",
+ " 123 | \n",
" Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 8.000000 | \n",
- "
\n",
- " \n",
- " | 2586 | \n",
- " Vendita tardiva | \n",
- " (atto, vendita, atto) | \n",
- " 8 | \n",
- " Generica 2_non allegata documentazione | \n",
- " 1 | \n",
- " 1 | \n",
- " 8.000000 | \n",
- "
\n",
- " \n",
- " | 2590 | \n",
- " Generica | \n",
- " (manca, carta, circolazione) | \n",
- " 8 | \n",
- " Esportazione non annotata | \n",
- " 1 | \n",
- " 1 | \n",
- " 8.000000 | \n",
- "
\n",
- " \n",
- " | 2602 | \n",
- " Periodo diverso | \n",
- " (ricevuta, relativa, diverso) | \n",
- " 9 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 9.000000 | \n",
- "
\n",
- " \n",
- " | 2610 | \n",
- " Regione diversa | \n",
- " (regione, bollo, pagato) | \n",
- " 9 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 9.000000 | \n",
- "
\n",
- " \n",
- " | 2609 | \n",
- " Generica | \n",
- " (dichiara, aver, venduto) | \n",
- " 9 | \n",
- " Vendita tardiva | \n",
- " 1 | \n",
- " 1 | \n",
- " 9.000000 | \n",
- "
\n",
- " \n",
- " | 2614 | \n",
- " Vendita tardiva | \n",
- " (tardivo, veicolo, venduto) | \n",
- " 10 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 10.000000 | \n",
- "
\n",
- " \n",
- " | 2621 | \n",
- " Periodo diverso | \n",
- " (allegato, corrisponde, periodo) | \n",
- " 10 | \n",
- " Regione diversa | \n",
- " 1 | \n",
- " 1 | \n",
- " 10.000000 | \n",
- "
\n",
- " \n",
- " | 2613 | \n",
- " Vendita tardiva | \n",
- " (dovuto, atto, di) | \n",
- " 10 | \n",
- " Periodo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 10.000000 | \n",
- "
\n",
- " \n",
- " | 2620 | \n",
- " Periodo diverso | \n",
- " (non, congruo, allega) | \n",
- " 10 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 10.000000 | \n",
- "
\n",
- " \n",
- " | 2637 | \n",
- " Periodo diverso | \n",
- " (allega, versamento, anno) | \n",
- " 11 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 11.000000 | \n",
- "
\n",
- " \n",
- " | 2624 | \n",
- " Periodo diverso | \n",
- " (allegata, ricevuta, relativa) | \n",
- " 11 | \n",
- " Veicolo diverso | \n",
- " 1 | \n",
- " 1 | \n",
- " 11.000000 | \n",
- "
\n",
- " \n",
- " | 2650 | \n",
- " Periodo diverso | \n",
- " (versamento, riferito, periodo) | \n",
- " 13 | \n",
- " Generica | \n",
- " 1 | \n",
- " 1 | \n",
- " 13.000000 | \n",
- "
\n",
- " \n",
- " | 2661 | \n",
- " Periodo diverso | \n",
- " (versamento, allegato, riferito) | \n",
+ " (x000d, x000d) | \n",
" 15 | \n",
- " Veicolo diverso | \n",
" 1 | \n",
- " 1 | \n",
- " 15.000000 | \n",
+ " 41.112600 | \n",
"
\n",
" \n",
- " | 2671 | \n",
- " Vendita tardiva | \n",
- " (vendita, atto, di) | \n",
- " 17 | \n",
- " Generica 2_non allegata documentazione | \n",
+ " 124 | \n",
+ " Generica | \n",
+ " (essere, mai) | \n",
+ " 15 | \n",
" 1 | \n",
- " 1 | \n",
- " 17.000000 | \n",
+ " 41.112600 | \n",
"
\n",
" \n",
- " | 2693 | \n",
- " Vendita tardiva | \n",
- " (vendita, tardivo, atto) | \n",
- " 29 | \n",
- " Acquisto nel mese di rinnovo; privato | \n",
+ " 125 | \n",
+ " Generica | \n",
+ " (n, licenza) | \n",
+ " 15 | \n",
+ " 2 | \n",
+ " 35.030624 | \n",
+ "
\n",
+ " \n",
+ " | 126 | \n",
+ " Generica | \n",
+ " (stato, proprietario) | \n",
+ " 12 | \n",
" 1 | \n",
+ " 32.890080 | \n",
+ "
\n",
+ " \n",
+ " | 127 | \n",
+ " Generica | \n",
+ " (documento, identità) | \n",
+ " 12 | \n",
" 1 | \n",
- " 29.000000 | \n",
+ " 32.890080 | \n",
+ "
\n",
+ " \n",
+ " | 128 | \n",
+ " Generica | \n",
+ " (cliente, aver) | \n",
+ " 16 | \n",
+ " 3 | \n",
+ " 32.763085 | \n",
"
\n",
" \n",
"\n",
""
],
"text/plain": [
- " CASISTICA_MOTIVAZIONE \\\n",
- "2627 Generica \n",
- "2626 Generica \n",
- "2625 Periodo diverso \n",
- "2587 Furto non annotato \n",
- "2588 Furto non annotato \n",
- "2386 Periodo diverso \n",
- "2335 Regione diversa \n",
- "2347 Furto non annotato \n",
- "2356 Vendita tardiva \n",
- "2384 Periodo diverso \n",
- "2379 Vendita tardiva \n",
- "2345 Furto non annotato \n",
- "2302 Periodo diverso \n",
- "2340 Generica \n",
- "2315 No esenzione PH \n",
- "2295 Periodo diverso \n",
- "2296 Generica \n",
- "2317 Generica \n",
- "2316 Esenzione PH senza istanza \n",
- "2336 Periodo diverso \n",
- "2355 Generica \n",
- "2282 Generica \n",
- "2280 Vendita tardiva \n",
- "2273 Generica \n",
- "2277 Generica \n",
- "2330 Regione diversa \n",
- "2383 Vendita tardiva \n",
- "2272 Periodo diverso \n",
- "2270 Generica \n",
- "2309 Generica \n",
- "2279 Generica \n",
- "2304 Periodo diverso \n",
- "2645 Vendita tardiva \n",
- "2646 Vendita tardiva \n",
- "2607 Generica \n",
- "2608 Generica \n",
- "2463 Periodo diverso \n",
- "2616 Periodo diverso \n",
- "2615 Periodo diverso \n",
- "2467 Periodo diverso \n",
- "2462 Generica \n",
- "2390 Vendita tardiva \n",
- "2612 Furto non annotato \n",
- "2395 Generica \n",
- "2394 Periodo diverso \n",
- "2476 Periodo diverso \n",
- "2448 Generica \n",
- "2446 Generica \n",
- "2420 Esenzione PH senza istanza \n",
- "2611 Furto non annotato \n",
- "2662 Generica \n",
- "2664 Generica \n",
- "2665 Generica \n",
- "2666 Generica \n",
- "2663 Generica \n",
- "2635 Periodo diverso \n",
- "2636 Periodo diverso \n",
- "2483 Generica \n",
- "2639 Generica \n",
- "2534 Periodo diverso \n",
- "2512 Periodo diverso \n",
- "2533 Generica \n",
- "2518 Vendita tardiva \n",
- "2482 Periodo diverso \n",
- "2642 Periodo diverso \n",
- "2644 Periodo diverso \n",
- "2643 Periodo diverso \n",
- "2479 Periodo diverso \n",
- "2652 Generica \n",
- "2651 Generica \n",
- "2683 Periodo diverso \n",
- "2680 Periodo diverso \n",
- "2682 Periodo diverso \n",
- "2681 Periodo diverso \n",
- "2737 Vendita tardiva \n",
- "2740 Vendita tardiva \n",
- "2745 Vendita tardiva \n",
- "2744 Vendita tardiva \n",
- "2743 Vendita tardiva \n",
- "2739 Vendita tardiva \n",
- "2738 Vendita tardiva \n",
- "2742 Vendita tardiva \n",
- "2741 Vendita tardiva \n",
- "2654 Vendita tardiva \n",
- "2653 Vendita tardiva \n",
- "2579 Generica \n",
- "2572 Periodo diverso \n",
- "2576 Periodo diverso \n",
- "2578 Periodo diverso \n",
- "2566 Periodo diverso \n",
- "2731 Vendita tardiva \n",
- "2733 Vendita tardiva \n",
- "2732 Vendita tardiva \n",
- "2735 Vendita tardiva \n",
- "2734 Vendita tardiva \n",
- "2736 Vendita tardiva \n",
- "2730 Vendita tardiva \n",
- "2591 Periodo diverso \n",
- "2589 Fermo \n",
- "2583 Furto non annotato \n",
- "2586 Vendita tardiva \n",
- "2590 Generica \n",
- "2602 Periodo diverso \n",
- "2610 Regione diversa \n",
- "2609 Generica \n",
- "2614 Vendita tardiva \n",
- "2621 Periodo diverso \n",
- "2613 Vendita tardiva \n",
- "2620 Periodo diverso \n",
- "2637 Periodo diverso \n",
- "2624 Periodo diverso \n",
- "2650 Periodo diverso \n",
- "2661 Periodo diverso \n",
- "2671 Vendita tardiva \n",
- "2693 Vendita tardiva \n",
+ " CASISTICA_MOTIVAZIONE n-gram count_placeholder \\\n",
+ "119 Generica (carta, circolazione) 85 \n",
+ "120 Generica (iscrizione, asi) 19 \n",
+ "121 Generica (codice, fiscale) 18 \n",
+ "122 Generica (presa, carico) 23 \n",
+ "123 Generica (x000d, x000d) 15 \n",
+ "124 Generica (essere, mai) 15 \n",
+ "125 Generica (n, licenza) 15 \n",
+ "126 Generica (stato, proprietario) 12 \n",
+ "127 Generica (documento, identità) 12 \n",
+ "128 Generica (cliente, aver) 16 \n",
"\n",
- " NOTE_OPERATORE_split_3gram count_placeholder \\\n",
- "2627 (mai, stato, proprietario) 11 \n",
- "2626 (mai, stato, proprietario) 11 \n",
- "2625 (manca, vers, allega) 11 \n",
- "2587 (annotata, pra, già) 8 \n",
- "2588 (annotata, pra, già) 8 \n",
- "2386 (periodo, tributario, versamento) 4 \n",
- "2335 (versamento, favore, regione) 4 \n",
- "2347 (furto, allega, denuncia) 4 \n",
- "2356 (vendita, bollo, dovuto) 4 \n",
- "2384 (versamento, allegato, relativo) 4 \n",
- "2379 (periodo, tributario, già) 4 \n",
- "2345 (denuncia, furto, mai) 4 \n",
- "2302 (allega, bollo, pagato) 4 \n",
- "2340 (presa, carico, demolitore) 4 \n",
- "2315 (invalidità, idoneo, rilascio) 4 \n",
- "2295 (non, presente, bollo) 4 \n",
- "2296 (altra, regione, periodo) 4 \n",
- "2317 (nessun, versamento, presente) 4 \n",
- "2316 (presente, cliente, avvisato) 4 \n",
- "2336 (non, presente, ricevuta) 4 \n",
- "2355 (domiciliazione, bancaria, attiva) 4 \n",
- "2282 (visura, pra, risulta) 4 \n",
- "2280 (veicolo, venduto, mese) 4 \n",
- "2273 (bollo, dovuto, cliente) 4 \n",
- "2277 (perdita, possesso, trascritta) 4 \n",
- "2330 (versamento, effettuato, favore) 4 \n",
- "2383 (utile, atto, di) 4 \n",
- "2272 (non, congruo, versamento) 4 \n",
- "2270 (pratica, lavorata, nuovo) 4 \n",
- "2309 (veicolo, demolito, periodo) 4 \n",
- "2279 (targa, errata, targa) 4 \n",
- "2304 (presente, allega, versamenti) 4 \n",
- "2645 (vendita, tardivo, veicolo) 13 \n",
- "2646 (vendita, tardivo, veicolo) 13 \n",
- "2607 (veicolo, targato, targa) 9 \n",
- "2608 (veicolo, targato, targa) 9 \n",
- "2463 (regione, versamento, non) 5 \n",
- "2616 (versamento, riferito, altra) 10 \n",
- "2615 (versamento, riferito, altra) 10 \n",
- "2467 (richiesta, versamento, non) 5 \n",
- "2462 (atto, altra, regione) 5 \n",
- "2390 (bollo, dovuto, vendita) 5 \n",
- "2612 (perdita, possesso, furto) 10 \n",
- "2395 (rientro, possesso, data) 5 \n",
- "2394 (presente, aci/tabaccaio/agenzia, versamento) 5 \n",
- "2476 (allega, ricevuta, pagamento) 5 \n",
- "2448 (dichiara, aver, pagato) 5 \n",
- "2446 (disabile, fiscalmente, carico) 5 \n",
- "2420 (disabile, respinta, manca) 5 \n",
- "2611 (perdita, possesso, furto) 10 \n",
- "2662 (cliente, dichiara, aver) 16 \n",
- "2664 (allega, carta, circolazione) 16 \n",
- "2665 (allega, carta, circolazione) 16 \n",
- "2666 (allega, carta, circolazione) 16 \n",
- "2663 (cliente, dichiara, aver) 16 \n",
- "2635 (non, presente, versamento) 11 \n",
- "2636 (non, presente, versamento) 11 \n",
- "2483 (documentazione, allegata, targa) 6 \n",
- "2639 (allega, certificato, storico) 12 \n",
- "2534 (x, periodo, tributario) 6 \n",
- "2512 (versamento, allegato, anno) 6 \n",
- "2533 (carta, circolazione, annotazione) 6 \n",
- "2518 (pagamento, atto, di) 6 \n",
- "2482 (non, presente, allegato) 6 \n",
- "2642 (bollo, allegato, corrisponde) 12 \n",
- "2644 (bollo, pagato, x) 12 \n",
- "2643 (bollo, pagato, x) 12 \n",
- "2479 (allegato, anno, manca) 6 \n",
- "2652 (atto, data, certa) 13 \n",
- "2651 (atto, data, certa) 13 \n",
- "2683 (presente, non, congruo) 27 \n",
- "2680 (versam, presente, non) 27 \n",
- "2682 (presente, non, congruo) 27 \n",
- "2681 (versam, presente, non) 27 \n",
- "2737 (atto, di, vendita) 152 \n",
- "2740 (atto, di, vendita) 152 \n",
- "2745 (atto, di, vendita) 152 \n",
- "2744 (atto, di, vendita) 152 \n",
- "2743 (atto, di, vendita) 152 \n",
- "2739 (atto, di, vendita) 152 \n",
- "2738 (atto, di, vendita) 152 \n",
- "2742 (atto, di, vendita) 152 \n",
- "2741 (atto, di, vendita) 152 \n",
- "2654 (dovuto, versamento, non) 14 \n",
- "2653 (dovuto, versamento, non) 14 \n",
- "2579 (allega, presa, carico) 7 \n",
- "2572 (presente, allega, versamento) 7 \n",
- "2576 (corrisponde, periodo, richiesto) 7 \n",
- "2578 (pagato, x, periodo) 7 \n",
- "2566 (ricevuta, allegata, riferita) 7 \n",
- "2731 (di, vendita, tardivo) 147 \n",
- "2733 (di, vendita, tardivo) 147 \n",
- "2732 (di, vendita, tardivo) 147 \n",
- "2735 (di, vendita, tardivo) 147 \n",
- "2734 (di, vendita, tardivo) 147 \n",
- "2736 (di, vendita, tardivo) 147 \n",
- "2730 (di, vendita, tardivo) 147 \n",
- "2591 (riferito, periodo, tributario) 8 \n",
- "2589 (fermo, amministrativo, fermo) 8 \n",
- "2583 (furto, mai, trascritto) 8 \n",
- "2586 (atto, vendita, atto) 8 \n",
- "2590 (manca, carta, circolazione) 8 \n",
- "2602 (ricevuta, relativa, diverso) 9 \n",
- "2610 (regione, bollo, pagato) 9 \n",
- "2609 (dichiara, aver, venduto) 9 \n",
- "2614 (tardivo, veicolo, venduto) 10 \n",
- "2621 (allegato, corrisponde, periodo) 10 \n",
- "2613 (dovuto, atto, di) 10 \n",
- "2620 (non, congruo, allega) 10 \n",
- "2637 (allega, versamento, anno) 11 \n",
- "2624 (allegata, ricevuta, relativa) 11 \n",
- "2650 (versamento, riferito, periodo) 13 \n",
- "2661 (versamento, allegato, riferito) 15 \n",
- "2671 (vendita, atto, di) 17 \n",
- "2693 (vendita, tardivo, atto) 29 \n",
- "\n",
- " CASISTICA_MOTIVAZIONE_selfjoin count_selfjoin \\\n",
- "2627 Periodo diverso 2 \n",
- "2626 No esenzione PH 1 \n",
- "2625 Generica 3 \n",
- "2587 Esportazione non annotata 1 \n",
- "2588 Generica 1 \n",
- "2386 Generica 1 \n",
- "2335 Periodo diverso 1 \n",
- "2347 Generica 1 \n",
- "2356 Generica 1 \n",
- "2384 Vendita tardiva 1 \n",
- "2379 Periodo diverso 1 \n",
- "2345 Generica 1 \n",
- "2302 Generica 1 \n",
- "2340 Fermo 1 \n",
- "2315 Generica 1 \n",
- "2295 Vendita tardiva 1 \n",
- "2296 Acquisto nel mese di rinnovo; concessionario 1 \n",
- "2317 Periodo diverso 1 \n",
- "2316 Generica 1 \n",
- "2336 Ricevuta non valida 1 \n",
- "2355 Domiciliazione tardiva 1 \n",
- "2282 Vendita tardiva 1 \n",
- "2280 Generica 1 \n",
- "2273 Demolizione 1 \n",
- "2277 Sequestro non annotato 1 \n",
- "2330 Periodo diverso 1 \n",
- "2383 Acquisto nel mese di rinnovo; privato 1 \n",
- "2272 Veicolo diverso 1 \n",
- "2270 Periodo diverso 1 \n",
- "2309 Demolizione 1 \n",
- "2279 Regione diversa 1 \n",
- "2304 Veicolo diverso 1 \n",
- "2645 Acquisto nel mese di rinnovo; concessionario 1 \n",
- "2646 Acquisto nel mese di rinnovo; privato 2 \n",
- "2607 No esenzione PH 1 \n",
- "2608 Veicolo diverso 1 \n",
- "2463 Regione diversa 1 \n",
- "2616 Veicolo diverso 1 \n",
- "2615 Generica 1 \n",
- "2467 Esenzione PH senza istanza 1 \n",
- "2462 Acquisto nel mese di rinnovo; privato 1 \n",
- "2390 Generica 2_non allegata documentazione 1 \n",
- "2612 Rientro in possesso 1 \n",
- "2395 Rientro in possesso 1 \n",
- "2394 Ricevuta non valida 1 \n",
- "2476 Generica 1 \n",
- "2448 Vendita tardiva 1 \n",
- "2446 No esenzione PH 1 \n",
- "2420 No esenzione PH 1 \n",
- "2611 Generica 1 \n",
- "2662 Vendita tardiva 1 \n",
- "2664 Esenzione PH senza istanza 1 \n",
- "2665 Esportazione non annotata 1 \n",
- "2666 Vendita tardiva 1 \n",
- "2663 Esportazione non annotata 2 \n",
- "2635 Regione diversa 1 \n",
- "2636 Veicolo diverso 1 \n",
- "2483 Periodo diverso 1 \n",
- "2639 Esenzione PH senza istanza 2 \n",
- "2534 Generica 1 \n",
- "2512 Generica 1 \n",
- "2533 Esenzione PH senza istanza 1 \n",
- "2518 Acquisto nel mese di rinnovo; privato 1 \n",
- "2482 Esenzione PH senza istanza 1 \n",
- "2642 Generica 2 \n",
- "2644 Regione diversa 1 \n",
- "2643 Generica 1 \n",
- "2479 Generica 1 \n",
- "2652 Furto non annotato 1 \n",
- "2651 Esportazione non annotata 1 \n",
- "2683 Veicolo diverso 3 \n",
- "2680 Versamento annullato 1 \n",
- "2682 Versamento annullato 1 \n",
- "2681 Veicolo diverso 3 \n",
- "2737 Domiciliazione tardiva 1 \n",
- "2740 No minivoltura 1 \n",
- "2745 Acquisto nel mese di rinnovo; privato 7 \n",
- "2744 Periodo diverso 6 \n",
- "2743 Demolizione 2 \n",
- "2739 Generica 2_non allegata documentazione 1 \n",
- "2738 Esportazione non annotata 1 \n",
- "2742 Acquisto nel mese di rinnovo; concessionario 2 \n",
- "2741 Veicolo diverso 1 \n",
- "2654 Perdita possesso con DS successiva 1 \n",
- "2653 Esportazione non annotata 1 \n",
- "2579 Fermo 1 \n",
- "2572 Veicolo diverso 1 \n",
- "2576 Regione diversa 1 \n",
- "2578 Generica 1 \n",
- "2566 Veicolo diverso 1 \n",
- "2731 Domiciliazione tardiva 1 \n",
- "2733 Veicolo diverso 1 \n",
- "2732 No minivoltura 1 \n",
- "2735 Periodo diverso 6 \n",
- "2734 Acquisto nel mese di rinnovo; concessionario 2 \n",
- "2736 Acquisto nel mese di rinnovo; privato 7 \n",
- "2730 Demolizione 1 \n",
- "2591 Generica 1 \n",
- "2589 Generica 1 \n",
- "2583 Generica 1 \n",
- "2586 Generica 2_non allegata documentazione 1 \n",
- "2590 Esportazione non annotata 1 \n",
- "2602 Veicolo diverso 1 \n",
- "2610 Generica 1 \n",
- "2609 Vendita tardiva 1 \n",
- "2614 Generica 1 \n",
- "2621 Regione diversa 1 \n",
- "2613 Periodo diverso 1 \n",
- "2620 Veicolo diverso 1 \n",
- "2637 Veicolo diverso 1 \n",
- "2624 Veicolo diverso 1 \n",
- "2650 Generica 1 \n",
- "2661 Veicolo diverso 1 \n",
- "2671 Generica 2_non allegata documentazione 1 \n",
- "2693 Acquisto nel mese di rinnovo; privato 1 \n",
- "\n",
- " sum_selfjoin tf_idf \n",
- "2627 3 3.666667 \n",
- "2626 3 3.666667 \n",
- "2625 3 3.666667 \n",
- "2587 2 4.000000 \n",
- "2588 2 4.000000 \n",
- "2386 1 4.000000 \n",
- "2335 1 4.000000 \n",
- "2347 1 4.000000 \n",
- "2356 1 4.000000 \n",
- "2384 1 4.000000 \n",
- "2379 1 4.000000 \n",
- "2345 1 4.000000 \n",
- "2302 1 4.000000 \n",
- "2340 1 4.000000 \n",
- "2315 1 4.000000 \n",
- "2295 1 4.000000 \n",
- "2296 1 4.000000 \n",
- "2317 1 4.000000 \n",
- "2316 1 4.000000 \n",
- "2336 1 4.000000 \n",
- "2355 1 4.000000 \n",
- "2282 1 4.000000 \n",
- "2280 1 4.000000 \n",
- "2273 1 4.000000 \n",
- "2277 1 4.000000 \n",
- "2330 1 4.000000 \n",
- "2383 1 4.000000 \n",
- "2272 1 4.000000 \n",
- "2270 1 4.000000 \n",
- "2309 1 4.000000 \n",
- "2279 1 4.000000 \n",
- "2304 1 4.000000 \n",
- "2645 3 4.333333 \n",
- "2646 3 4.333333 \n",
- "2607 2 4.500000 \n",
- "2608 2 4.500000 \n",
- "2463 1 5.000000 \n",
- "2616 2 5.000000 \n",
- "2615 2 5.000000 \n",
- "2467 1 5.000000 \n",
- "2462 1 5.000000 \n",
- "2390 1 5.000000 \n",
- "2612 2 5.000000 \n",
- "2395 1 5.000000 \n",
- "2394 1 5.000000 \n",
- "2476 1 5.000000 \n",
- "2448 1 5.000000 \n",
- "2446 1 5.000000 \n",
- "2420 1 5.000000 \n",
- "2611 2 5.000000 \n",
- "2662 3 5.333333 \n",
- "2664 3 5.333333 \n",
- "2665 3 5.333333 \n",
- "2666 3 5.333333 \n",
- "2663 3 5.333333 \n",
- "2635 2 5.500000 \n",
- "2636 2 5.500000 \n",
- "2483 1 6.000000 \n",
- "2639 2 6.000000 \n",
- "2534 1 6.000000 \n",
- "2512 1 6.000000 \n",
- "2533 1 6.000000 \n",
- "2518 1 6.000000 \n",
- "2482 1 6.000000 \n",
- "2642 2 6.000000 \n",
- "2644 2 6.000000 \n",
- "2643 2 6.000000 \n",
- "2479 1 6.000000 \n",
- "2652 2 6.500000 \n",
- "2651 2 6.500000 \n",
- "2683 4 6.750000 \n",
- "2680 4 6.750000 \n",
- "2682 4 6.750000 \n",
- "2681 4 6.750000 \n",
- "2737 22 6.909091 \n",
- "2740 22 6.909091 \n",
- "2745 22 6.909091 \n",
- "2744 22 6.909091 \n",
- "2743 22 6.909091 \n",
- "2739 22 6.909091 \n",
- "2738 22 6.909091 \n",
- "2742 22 6.909091 \n",
- "2741 22 6.909091 \n",
- "2654 2 7.000000 \n",
- "2653 2 7.000000 \n",
- "2579 1 7.000000 \n",
- "2572 1 7.000000 \n",
- "2576 1 7.000000 \n",
- "2578 1 7.000000 \n",
- "2566 1 7.000000 \n",
- "2731 19 7.736842 \n",
- "2733 19 7.736842 \n",
- "2732 19 7.736842 \n",
- "2735 19 7.736842 \n",
- "2734 19 7.736842 \n",
- "2736 19 7.736842 \n",
- "2730 19 7.736842 \n",
- "2591 1 8.000000 \n",
- "2589 1 8.000000 \n",
- "2583 1 8.000000 \n",
- "2586 1 8.000000 \n",
- "2590 1 8.000000 \n",
- "2602 1 9.000000 \n",
- "2610 1 9.000000 \n",
- "2609 1 9.000000 \n",
- "2614 1 10.000000 \n",
- "2621 1 10.000000 \n",
- "2613 1 10.000000 \n",
- "2620 1 10.000000 \n",
- "2637 1 11.000000 \n",
- "2624 1 11.000000 \n",
- "2650 1 13.000000 \n",
- "2661 1 15.000000 \n",
- "2671 1 17.000000 \n",
- "2693 1 29.000000 "
+ " sum_selfjoin metric \n",
+ "119 7 115.136381 \n",
+ "120 1 52.075960 \n",
+ "121 1 49.335120 \n",
+ "122 3 47.096935 \n",
+ "123 1 41.112600 \n",
+ "124 1 41.112600 \n",
+ "125 2 35.030624 \n",
+ "126 1 32.890080 \n",
+ "127 1 32.890080 \n",
+ "128 3 32.763085 "
]
},
- "execution_count": 91,
+ "execution_count": 227,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
- "n=3\n",
- "splitted_col_name = \"NOTE_OPERATORE_split_{}gram\".format(str(n))\n",
+ "b[b[\"CASISTICA_MOTIVAZIONE\"]==\"Generica\"]"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "id": "a788c9fe",
+ "metadata": {},
+ "outputs": [],
+ "source": [
"df_cp=df.copy()\n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].fillna(\"NULL\")\n",
+ "\n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"]\n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].str.replace(\"x000d\", \" \")\n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].str.replace(\"000d\", \" \")\n",
+ "\n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].apply(lambda x: remove_stopwords(x))\n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].apply(lambda x: replace_punct(x))\n",
+ "\n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].str.replace(\"/\", \" \", regex=True) \n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].str.replace(r\"\\s+\", \" \", regex=True) \n",
+ "#df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].str.replace({\"à\":\"a\", \"è\":\"e\", \"ì\":\"i\", \"ò\":\"o\", \"ù\":\"u\"}) \n",
+ "df_cp[\"NOTE_OPERATORE\"] = df_cp[\"NOTE_OPERATORE\"].str.lower()\n",
+ "\n",
+ "\n",
+ "vectorizer = CountVectorizer(ngram_range=(1, 1))\n",
+ "X = vectorizer.fit_transform(df_cp[\"NOTE_OPERATORE\"])\n",
+ "word_count_df = pd.DataFrame({\"word\":vectorizer.get_feature_names_out(), \"word_count_per_doc\" : X.toarray().transpose().tolist() })\n",
+ "\n",
+ "\n"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 39,
+ "id": "af067ccd",
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/html": [
+ "