2022-11-13 데이터마이닝_7

2022. 11. 13. 17:27학부 강의/데이터마이닝

 

1. 연관규칙

 

대량의 데이터에서 빈번하게 발생하는 데이터의 패턴을 찾는 것.

 

맥주를 사는 사람은 마른안주도 함께 구매한다.

 

장바구니 분석이라고도 함.

 

  • 지지도(support)
    : 특정 아이템이 데이터에서 발생하는 빈도
    : A와 B를 동시에 포함하는 거래수 / 전체 거래수
  • 신뢰도(confidence)
    : 두 아이템의 연관규칙이 유용한 규칙일 가능성의 척도 (높을수록 좋다)
    : A와 B를 동시에 포함하는 거래수 / A를 포함하는 거래수
  • 향상도(lift)
    : 두 아이템의 연관규칙이 우연인지 아닌지를 나타내는 척도 (1을 기준으로 크거나 작아야 의미 있는 규칙이다)
    : A와 B를 동시에 포함하는 거래수 / A포함거래수 * B포함거래수

 

출처 : https://welcome-to-dewy-world.tistory.com/61

 


가. 실습

 

install.packages("arules")
install.packages("arulesViz")
library(arules)
library(arulesViz)
  • arules : Mining Association Rules and Frequent Itemsets (연결 규칙 및 빈도 마이닝)
  • arulesViz: Visualizing Association Rules and Frequent Itemsets (연결 규칙 및 빈도 시각화)

 

sports <- read.csv("sport.csv", header = TRUE, sep =",")
str(sports)
head(sports)
sports_ar <- sports[,-1]
  • sports_ar <- sports[,-1] : 1번 열을 제외한 나머지 열들을 가로로 나열.

 

 

sports_ar$baseball <- as.factor(sports_ar$baseball)
sports_ar$basketball <- as.factor(sports_ar$basketball)
sports_ar$soccer <- as.factor(sports_ar$soccer)

sports$soccer
sports_ar$soccer

 

baseball, basketball 그리고 soccer에 들어있는 0과 1을 숫자가 아닌 factor로 인식하도록 한다.

 

read.csv(…., stringsAsFactors = true) 옵션을 사용하지 않은 것은 string 타입이 아니기 때문이다.

 

사용하면 이상하게 동작한다. 주의할 것.

 

rules <- apriori(sports_ar)
rules
inspect(rules)

 

  • rules ← apriori(sports_ar) : 데이터셋이 큰 경우 효율적으로 연관규칙을 생성하기 위해 apriori 알고리즘을 사용한다.
  • inspect(rules) : 생성된 규칙들을 확인합니다.

 

출처 : https://carrot-woo.tistory.com/57

 


2. AI 이미지

 

 

 

최근에 AI가 그린 그림이 미술대회에서 대상을 수상한 일이 있었다.

 

또 작가들이 자신의 작품이 AI의 학습 데이터로 활용되는 것에 반대하고 나선 일도 있었다.

 

AI 기술이 발전함에 따라서 산업이 변화하고 있다는 것을 체감한 첫 번째 사건이다.

 

이번 수업시간에는 이와 관련된 신기술들을 탐방해 보았다.

 


가. deepai

 

원하는 장면을 텍스트로 묘사하면 이를 이미지로 생성해주는 사이트다.

 

링크 : https://deepai.org/machine-learning-model/text2img

 

 


나. autodraw

 

그림을 대충 그리면 알아서 완성시켜주는 사이트다.

 

링크 : https://www.autodraw.com/

 

 


다. portraital

 

사진을 넣으면 중세의 초상화풍으로 바꿔준다.

 

링크 : https://portraitai.app/

 

누구세요?

 


라. whichfaceisreal

 

진짜 사람과 AI가 만든 사람을 구별해보는 사이트다.

 

링크 : https://www.whichfaceisreal.com/

 

 


마. petalica.com

 

어… 음…

 

씹덕이 아니라

 

그림 채색을 도와주는 사이트다.

 

링크 : https://petalica.com/index_en.html

 

 


'학부 강의 > 데이터마이닝' 카테고리의 다른 글

2022-11-26 데이터마이닝_9  (0) 2022.11.26
2022-11-13 데이터마이닝_8  (0) 2022.11.13
2022-10-14 데이터마이닝_6  (0) 2022.10.14
2022-10-06 데이터마이닝_5  (0) 2022.10.06
2022-09-28 데이터마이닝_4  (0) 2022.09.28