99 lines
		
	
	
		
			2.7 KiB
		
	
	
	
		
			Python
		
	
	
	
	
	
			
		
		
	
	
			99 lines
		
	
	
		
			2.7 KiB
		
	
	
	
		
			Python
		
	
	
	
	
	
| # 패키지 불러오기
 | |
| import os
 | |
| from urllib.parse import quote_plus
 | |
| 
 | |
| import pymysql
 | |
| from sqlalchemy import create_engine
 | |
| import pandas as pd
 | |
| from datetime import date
 | |
| from dateutil.relativedelta import relativedelta
 | |
| import requests as rq
 | |
| import time
 | |
| from tqdm import tqdm
 | |
| from io import BytesIO
 | |
| from dotenv import load_dotenv
 | |
| 
 | |
| load_dotenv()
 | |
| user = os.getenv('DB_USER')
 | |
| pw = os.getenv('DB_PW')
 | |
| engine_for_pw = quote_plus(pw)
 | |
| host = os.getenv('DB_HOST')
 | |
| port = int(os.getenv('DB_PORT'))
 | |
| db = os.getenv('DB_DB')
 | |
| 
 | |
| # DB 연결
 | |
| engine = create_engine(f'mysql+pymysql://{user}:{engine_for_pw}@{host}:{port}/{db}')
 | |
| con = pymysql.connect(user=user,
 | |
|                       passwd=pw,
 | |
|                       host=host,
 | |
|                       port=port,
 | |
|                       db=db,
 | |
|                       charset='utf8')
 | |
| mycursor = con.cursor()
 | |
| 
 | |
| # 티커리스트 불러오기
 | |
| ticker_list = pd.read_sql("""
 | |
| select * from kor_ticker
 | |
| where 기준일 = (select max(기준일) from kor_ticker) 
 | |
| 	and 종목구분 = '보통주';
 | |
| """, con=engine)
 | |
| 
 | |
| # DB 저장 쿼리
 | |
| query = """
 | |
|     insert into kor_price (날짜, 시가, 고가, 저가, 종가, 거래량, 종목코드)
 | |
|     values (%s,%s,%s,%s,%s,%s,%s) as new
 | |
|     on duplicate key update
 | |
|     시가 = new.시가, 고가 = new.고가, 저가 = new.저가,
 | |
|     종가 = new.종가, 거래량 = new.거래량;
 | |
| """
 | |
| 
 | |
| # 오류 발생시 저장할 리스트 생성
 | |
| error_list = []
 | |
| 
 | |
| # 전종목 주가 다운로드 및 저장
 | |
| for i in tqdm(range(0, len(ticker_list))):
 | |
| 
 | |
|     # 티커 선택
 | |
|     ticker = ticker_list['종목코드'][i]
 | |
| 
 | |
|     # 시작일과 종료일
 | |
|     fr = (date.today() + relativedelta(years=-5)).strftime("%Y%m%d")
 | |
|     to = (date.today()).strftime("%Y%m%d")
 | |
| 
 | |
|     # 오류 발생 시 이를 무시하고 다음 루프로 진행
 | |
|     try:
 | |
| 
 | |
|         # url 생성
 | |
|         url = f'''https://fchart.stock.naver.com/siseJson.nhn?symbol={ticker}&requestType=1
 | |
|         &startTime={fr}&endTime={to}&timeframe=day'''
 | |
| 
 | |
|         # 데이터 다운로드
 | |
|         data = rq.get(url).content
 | |
|         data_price = pd.read_csv(BytesIO(data))
 | |
| 
 | |
|         # 데이터 클렌징
 | |
|         price = data_price.iloc[:, 0:6]
 | |
|         price.columns = ['날짜', '시가', '고가', '저가', '종가', '거래량']
 | |
|         price = price.dropna()
 | |
|         price['날짜'] = price['날짜'].str.extract("(\d+)")
 | |
|         price['날짜'] = pd.to_datetime(price['날짜'])
 | |
|         price['종목코드'] = ticker
 | |
| 
 | |
|         # 주가 데이터를 DB에 저장
 | |
|         args = price.values.tolist()
 | |
|         mycursor.executemany(query, args)
 | |
|         con.commit()
 | |
| 
 | |
|     except:
 | |
| 
 | |
|         # 오류 발생시 error_list에 티커 저장하고 넘어가기
 | |
|         print(ticker)
 | |
|         error_list.append(ticker)
 | |
| 
 | |
|     # 타임슬립 적용
 | |
|     time.sleep(2)
 | |
| 
 | |
| # DB 연결 종료
 | |
| engine.dispose()
 | |
| con.close()
 |