!pip install -U scikit-learn
!pip install mlxtend


## Necessary libraries imported
import numpy as np
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori

import warnings
warnings.filterwarnings("ignore")


data = pd.read_csv(r'C:\Users\Arda\Downloads\GroceryStoreDataSet.csv',names=["products"],header=None)

data.head(10)


data.values

array([['MILK,BREAD,BISCUIT'],
       ['BREAD,MILK,BISCUIT,CORNFLAKES'],
       ['BREAD,TEA,BOURNVITA'],
       ['JAM,MAGGI,BREAD,MILK'],
       ['MAGGI,TEA,BISCUIT'],
       ['BREAD,TEA,BOURNVITA'],
       ['MAGGI,TEA,CORNFLAKES'],
       ['MAGGI,BREAD,TEA,BISCUIT'],
       ['JAM,MAGGI,BREAD,TEA'],
       ['BREAD,MILK'],
       ['COFFEE,COCK,BISCUIT,CORNFLAKES'],
       ['COFFEE,COCK,BISCUIT,CORNFLAKES'],
       ['COFFEE,SUGER,BOURNVITA'],
       ['BREAD,COFFEE,COCK'],
       ['BREAD,SUGER,BISCUIT'],
       ['COFFEE,SUGER,CORNFLAKES'],
       ['BREAD,SUGER,BOURNVITA'],
       ['BREAD,COFFEE,SUGER'],
       ['BREAD,COFFEE,SUGER'],
       ['TEA,MILK,COFFEE,CORNFLAKES']], dtype=object)


## We can transform it into the right format via the TransactionEncoder as follows:

transact=TransactionEncoder()
te_data=transact.fit(data).transform(data)
transact.columns_

df=pd.DataFrame(te_data,columns=transact.columns_)
df


a = apriori(df, min_support=0.38, use_colnames=True)
a.sort_values(ascending=False, axis=0,by='support')

	support	itemsets
1	0.606061	(E)
0	0.560606	(A)
2	0.439394	(R)
3	0.393939	(E, A)

Recep Arda Kaya - 435060¶

Apriori Association to Grocery Store Data Set¶

Objective¶

Data¶

Review of the Data ¶

Apriori Algorithm¶

Now, let us return the items and itemsets with at least 38% support:¶

Most frequent single items¶

COFFEE = 0.606061¶

BISCUIT = 0.560606¶

Most frequent set items¶

COFFEE AND BISCUIT = 0.393939¶

Conclusions ¶

References ¶

	products
0	MILK,BREAD,BISCUIT
1	BREAD,MILK,BISCUIT,CORNFLAKES
2	BREAD,TEA,BOURNVITA
3	JAM,MAGGI,BREAD,MILK
4	MAGGI,TEA,BISCUIT
5	BREAD,TEA,BOURNVITA
6	MAGGI,TEA,CORNFLAKES
7	MAGGI,BREAD,TEA,BISCUIT
8	JAM,MAGGI,BREAD,TEA
9	BREAD,MILK

	A	B	C	D	E	F	G	I	J	K	L	M	N	O	R	S	T	U	V
0	False	False	False	False	False	False	False	True	False	True	True	True	False	False	False	False	False	False	False
1	True	True	False	True	True	False	False	False	False	False	False	False	False	False	True	False	False	False	False
2	False	True	True	False	False	False	False	True	False	False	False	False	False	False	False	True	True	True	False
3	True	True	False	True	True	False	False	False	False	False	False	False	False	False	True	False	False	False	False
4	False	False	False	False	False	False	False	True	False	True	True	True	False	False	False	False	False	False	False
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
61	False	False	False	False	True	False	True	False	False	False	False	False	False	False	True	True	False	True	False
62	True	False	False	False	True	False	False	False	False	False	False	False	False	False	False	False	True	False	False
63	False	False	False	False	False	False	False	True	False	True	True	True	False	False	False	False	False	False	False
64	False	False	True	False	True	True	False	False	False	False	False	False	False	True	False	False	False	False	False
65	True	False	True	False	True	True	False	False	False	True	True	False	True	True	True	True	False	False	False