본문 바로가기

전체 글

[MySQL] 단어 포함 여부 간단 검색: like/ 숫자 자리수 표시: 언더스코어(__) 단어 포함 여부 간단 검색: like -- 문자열 포함 (Search) : like 키워드 -- 내가 찾고자 하는 문자열이, 컬럼에 포함되어있는지 확인하는 방법 -- 포함하고 있는 단어, (간단한 검색기능) -- the%: the 오른쪽에 무슨 문자가 와도 상관없다 -> the로 시작하는 데이터 검색 -- %the: the 왼쪽에 무슨 문자가 와도 상관없다 -> the로 끝나는 데이터 검색 -- %: 무슨 문자가 와도 상관없다. 라는 뜻 -- %the%: 앞 뒤 무슨 문자가 와도 상관없으니, the가 포함된 데이터 검색 -- 대소문자 구분할 필요없이 알아서 본인이 찾아준다. -- 책 제목에 the라고 들어있는(%) 책만 가져오시오. select * from books where title like '%t.. 더보기
[MySQL] 정렬하기: order by/ 몇 행의 데이터 가져오기: limit 정렬하기: order by -- 데이터 정렬 order by, sql문의 맨 마지막에 작성하는 것. + 내가 정렬할 컬럼. -- 내림차순 정렬은 desc, 오름차순 정렬은 디폴트이므로, 아무것도 안쓰거나, asc라고 써주면 된다. -- 컬럼 이름 대신, 숫자를 써도 된다. 숫자는 첫 컬럼부터(1) 뜻한다. -- 책 제목으로 정렬하세요. select * from books order by title; select * from books order by title desc; select * from books order by title asc; -- 년도 내림차순으로 정렬하여, 년도와 책 제목을 가져오시오. select released_year,title from books order by released_.. 더보기
[MySQL] 중복없이 데이터 가져오기: distinct use yh_db; select * from books; select * from yh_db.books; select * from 데이터베이스 이름.테이블 이름 -- 이때는 use 안써도 됨. .(점)의 뜻은 '~의'라는 뜻 insert into books (title, author_fname,author_lname,released_year,stock_quantity,pages) values ('10% Happier','Dan','Harris',2014, 29, 256), ('fake_book','Freida','Harris',2001,287,428), ('Lincon In The Bardo','George','Saunders', 2017, 111, 388); select * from books; 중복없.. 더보기
영화 추천 시스템 2/2 - 실습: star wars 를 본 사람들에게 영화를 추천할 것입니다. 5개의 추천 영화 제목을 찾으세요. ㄴ힌트 : 먼저 star wars 의 정확한 이름을 검색해서 찾으세요. 그리고 나서 스타워즈를 본 유저의 데이터를 가져와서, 위와 같이 상관관계분석을 합니다. movies_rating_df['title'].unique() # 찾아오는 방법은 또 있다. # moive_titles_df.loc[moive_titles_df['title'].str.lower().str.contains('star'),] # ...에서도 찾을 수 있다. df['Star Wars (1977)'] Startwars_corr = df.corrwith(df['Star Wars (1977)']) # 스타워즈와 모든 컬럼의 관계 Sta.. 더보기
영화 추천 시스템 1/2 추천시스템: 어떤 사람이 한 영화를 봤다. User-Based Collaborative Filtering - 유저 기반으로, 유저가 사거나 본 아이템을 행렬로 만든다 - 유저간의 유사도를 측정하여, 비슷한 유저를 찾는다. - 비슷한 유저를 기반으로 아이템을 추천해준다. -> 상당히 기본적인 방법이나 한계가 있더라. - 아이템(제품/영화 등)보다 유저가 많아지면, 복잡도가 올라간다. - 유저의 기호는 변한다. (오늘은 액션 시청, 내일은 로맨스 시청) - 따라서 유저기반의 협업 필터링보다, 아이템 기반의 협업 필터링을 사용한다. Item-Based Collaborative Filtering - 사람이 아닌 아이템(제품/영화 등)간의 관계를 기반으로 추천해주는 시스템 - 두 사람이, 타이타닉도 봤고, 웤투리.. 더보기
범죄율 예측: pd.to_datetime(), dt.weekday, 데이터 출처: https://www.kaggle.com/currie32/crimes-in-chicago ㄴ 2005-2007만 작업하기로 함. ㄴ 구글 드라이브 Colab Notebook에 파일 업로드 해놓음. 작업확경: Colab Notebook import pandas as pd import numpy as np import matplotlib.pyplot as plt import random import seaborn as sns from fbprophet import Prophet from google.colab import drive drive.mount('/content/drive') import os os.chdir('/content/drive/MyDrive/Colab Notebooks') .. 더보기
가격 예측 알고리즘: Facebook Prophet Facebook Prophet 페이스북에서 만든 라이브러리, 타임시리즈 데이터를 처리하는 것. install : pip install fbprophet 위 에러 발생시 : conda install -c conda-forge fbprophet ex) 아보카도 가격 예측 ㄴ 데이터는 미국의 아보카도 리테일 데이터 입니다. (2018년도 weekly 데이터) ㄴ 아보카도 거래량과 가격이 나와 있습니다. ㄴ 컬럼설명: - Date - The date of the observation - AveragePrice - the average price of a single avocado - type - conventional or organic - year - the year - Region - the city or .. 더보기
댓글의 긍정/부정 인공지능 알고리즘(나이브 베이즈/서포터 백터 머신) 작업확경: Colab Notebook 댓글을 봤을 때, 긍정/부정을 판단하는 인공지능을 만들려고 한다. ㄴ 긍정/부정을 판단하는 인공지능이기에, supervised Learning! ex) YELP 서비스의 리뷰 분석 (NLP) ㄴ stars 컬럼은, 유저가 1점부터 5점까지 준 별점이 들어있다. ㄴ text 컬럼은, 별점을 준 유저의 리뷰가 들어있다. ㄴ cool, useful, funny 컬럼은, 다른사람들이 이 리뷰 글에 투표한 숫자다. 따라서 쿨이 3개이면, 이 리뷰에 대해서 3명이 쿨에 공감했다는 뜻이다. - import libraries import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as.. 더보기