"A-priori"는 멀티 패스 알고리즘이다. 디스크(itemsets 데이터)를 한 번 지나며 데이터를 확인하는 것을 1-pass라고 하는데 multi-pass라는 것은 이것이 여러번 시행된다는 것. pass 수가 적을 수록 빠른 좋은 알고리즘 > {B,D}가 frequent itemset이면 그 부분집합인 {B}, {D} 또한 frequent하다는 명제의 대우를 사용하는 방법으로, "가지치기"를 통해 효율을 높이는 알고리즘이다. > {B}가 frequent하지 않다면, 초집합인 {B,C}, {B,D}, {B, C, D} . . .
{B}를 포함하는 모든 집합을 count하지 않겠다고 미리 설정하는 것 구체적인 알고리즘은 다음과 같다. Pass 1 : baskets을 순차적으로 읽으며 메인 메모리에서 각각의 개별 아이템이 몇 번 나타나는지 센다. single item이 얼마나 frequent한지 센다.
이때 필요한 메모리는 아이템의 개수만큼이고, ≥ s (minimum support...