np.select나 np.where의 조건을 사용하는 것보다 더 복잡한 연산을 수행해야하는 경우 병렬처리를 통해 빠르게 연산할 수 있다. 1. groupby할 필요없이 apply만 적용하는 경우 from multiprocessing import Pool import multiprocessing print('cpu counts:%d' % multiprocessing.cpu_count()) # cpu 최대 가용 수 확인 def parallelize_dataframe(df, func, n_cores = 2): df_split = np.array_split(n_cores) # n_cores의 개수만큼 df를 나눔 pool = Pool(n_cores) # pool을 core개수만큼 생성 df = pd.concat..