Python
train/test/validation 나누기 - splitfolders
인공지능 모델 학습을 위해 train/validation/test 데이터로 나눠준다. Train : 학습에 사용되는 훈련용 데이터 validation : 모델의 일반화 능력을 높이기 위해 학습중 평가에 사용되는 검증 데이터 Test : 학습이 끝난 후 모델의 성능을 평가하기 위한 테스트용 데이터 ✔︎ splitfolders 'splitfolders' 는 데이터 셋을 분리하기 위한 파이썬 라이브러리이다. # 설치 방법 !pip install split-folders # 사용방법 비율을 이용해서 데이터셋을 나누는 방법 train : val : test = 7 : 1 : 2 import splitfolders splitfolders.ratio('데이터 폴더 경로', output='output 폴더 경로', s..
[Python] Convert JPG to PNG (feat. PIL)
파이썬의 Pillow 라이브러리를 이용하여 이미지 형식을 바꿔보자. 1. Pillow 라이브러리 설치 pip install Pillow 2. JPG to PNG from PIL import Image im = Image.open('hello.jpg').convert('RGB') im.save('hello_png.png', 'png') 3. PNG to JPG from PIL import Image im = Image.open('hello.png').convert('RGB') im.save('hello_jpg.jpg', 'jpeg') 4. 그 외의 형식들 - JPG to WEBP from PIL import Image im = Image.open('hello.jpg').convert('RGB') im.sa..
[Python] 파일 이름 변경하기
폴더 안에 있는 파일의 이름을 변경하고 싶을 때, os모듈의 rename을 사용하면 쉽게 변경이 가능하다. 1. 폴더 안의 파일 이름을 가져온다. import os # 주어진 디렉토리에 있는 항목들의 이름을 담고 있는 리스트를 반환합니다. # 리스트는 임의의 순서대로 나열됩니다. file_path = 'Your Path' # 경로 지정 file_names = os.listdir(file_path) files = sorted(file_names) # 파일 이름 정렬 2. 파일 이름을 변경, 저장한다. for name in files: src = os.path.join(file_path, name) dst = name.replace('.dcm', '') # 변경하고 싶은 이름 지정 dst = os.path...
DataFrame 합치기2 (concat, merge, join)
데이터프레임 병합 : pd.merge() merge() 함수는 두 데이터프레임을 병합하는 기능을 수행한다는 점에서 pd.concat()함수와 동일하다. concat과의 차이점으로 merge는 두 데이터프레임을 각 데이터에 존재하는 고유값(key)을 기준으로 병합할때 사용한다. Default : pd.merge(df_left, df_right, how='inner', on=None) 두 개의 데이터 프레임을 생성해준다. df1 = pd.DataFrame({'data1': range(5), 'key': list('abcde')}) df2 = pd.DataFrame({'data2': range(3), 'key': list('efg')}) print(df1, '\n\n', df2) 더보기 [Output] dat..