예시를 위해 NumPy를 임포트 하고, 다음과 같은 random array를 이용하여 상관계수 메트릭스를 생성해 주었다. import numpy as np >>> sample = np.random.rand(4, 5) >>> sample array([[0.77392506, 0.09906371, 0.93374673, 0.47835984, 0.74820074], [0.58517649, 0.54654451, 0.68912933, 0.85703762, 0.09354503], [0.59461011, 0.23737879, 0.051128 , 0.33242827, 0.7303699 ], [0.30040008, 0.10771157, 0.31072352, 0.92200922, 0.05826817]]) >>> sample_..

먼저, 아스키코드란 미국정보교환표준부호 (American Standard Code for Information Interchange - ASCII)의 줄임말로 대표적인 문자 인코딩 방법을 의미한다. (https://ko.wikipedia.org/wiki/ASCII) 파이썬에서는 ord()와 chr()함수를 이용하여 아스키코드를 활용할 수 있다. ord() 함수는 문자를 아스키코드로 변환해 준다. 한글과 특수문자역시 가능하다. >>> ord('a') 97 >>> ord('h') 104 >>> ord('ㄷ') 12599 >>> ord('@') 64 chr() 함수는 반대로 아스키코드를 문자로 변환해 준다. >>> chr(97) 'a' >>> chr(104) 'h' >>> chr(12599) 'ㄷ' >>> c..

요즘 ABIDE (Autism Brain Imaging Data Exchange) 데이터 셋을 가지고 연구를 진행하고 있기 때문에, 그 중 참여자들의 phenotypic 데이터로 든 예시 pandas를 이용하여 데이터를 로드 했을 때, ABIDE에서 제공하고 있는 fMRI데이터는 세계 전역의 여러 기관에서 수집된 데이터이기 때문에, 데이터를 제공한 기관들의 리스트가 필요했다. 위의 캡쳐 이미지에서 보이듯이 SITE_ID 컬럼이 기관 코드를 갖고 있음. 방법 1) unique() 코드를 이용, 가장 간단함 위 사진과 같이 df.col_name.unique() or df[col_name'].unique()를 이용하면 unique한 컬럼 값을 array타입으로 출력한다. 방법 2) 일단 각 고유값 당 데이터가..

사용된 이미지는 영상처리리에서 시험용 이미지로 자주 쓰이고 있는 lena image이고 이를 sample.jpeg에 저장하여 사용하였다. import cv2 import numpy as np import matplotlib.pyplot as plt 1. 이미지 불러오기 img = cv2.imread('sample.jpeg', cv2.IMREAD_UNCHANGED) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) plt.imshow(img) plt.show() 2. 이미지를 흑백으로 변경하고 저장 gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) plt.imshow(gray_img, cmap='gray', vmin=0, vmax=255) p..
그동안은 한글 파일을 저장할 일이 없었기 때문에 인코딩 문제를 크게 겪지 않았으나, 한글로 된 파일을 저장해야 하는 상황이 잦아지면서 json파일 저장할 때에 한글 깨짐 현상이 발생함을 발견하였다. sample이라는 변수에 저장된 데이터를 sample.json파일로 저장할 때 원래 사용하던 코드는 아래와 같다. with open('sample.json', 'w') as json_file: json.dump(sample, json_file) encoding='utf-8-sig'를 추가하라는 글도 보았는데 이 파라이터만 추가하였을 때 문제가 해결되지 않았고 .write함수를 사용하면서 ensure_ascii=False도 추가하니 인코딩 문제가 해결되었다. with open('sample.json', 'w',..

5x5 크기의 이미지가 3x3 커널과 stride 크기가 2인 Convolution과정에 의해 2x2사이즈의 이미지로 축소되었다고 가정해 보자. 축소된 2x2 크기의 이미지를 다시 5x5 크기의 이미지 혹은 다른 크기의 이미지로 확대시키는 과정을 Upsampling이라고 한다. Transposed Convolution은 Convolution과정을 통해 Upsampling할 수 있는 한가지 방법이다. 흔히, Deconvolution이라고도 불리기도 하지만 Transposed Convolution과 Deconvolution은 다른 연산 과정을 통해 Upsampling을 진행한다. Deconvolution은 Convolution과정에서 사용되었던 수학적 연산의 역 계산을 통하여 이미지를 Upsampling한다..

나중에 변경할 경우 코드 내에서 일일이 수정하지 않아도 되게 하기 위해, 배치 사이즈, 학습률과 에폭 개수는 미리 딕셔너리에 설정해 주었음 현재 gpu를 사용할 수 없는 상태라ㅠㅠ 에폭 개수를 대폭 줄여 모델을 학습 시켰는데 cuda사용이 가능했다면 에폭 개수를 100 정도로 했었을 것 같다! args = { 'BATCH_SIZE': 5, 'LEARNING_RATE': 0.001, 'NUM_EPOCH': 20 } 파이토치 공식 홈페이지의 튜토리얼 페이지를 참고하여 데이터 다운로드 https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html#sphx-glr-beginner-blitz-cifar10-tutorial-py train_set = torc..

Text Summarisation을 위한 방법에는 크게 두가지가 있다. Extractive Summarisation - 원문에서 가장 중요한 문장들을 선택하고 이를 재구성하여 요약하는 방법 Abstractive Summrisation - 원문에서 중요한 정보들을 찾아내어 그 정보들을 가지고 새로운 문장들로 요약문을 생성하는 방법 이 글에서는 파이썬에서 구글의 Bert를 이용한 Bert Extractive Summarizer로 간단한 글의 extractive summarisation을 생성해 볼 예정이다. 먼저, pip에 Bert Extractive Summarizer을 설치하고, Summarizer의 작동을 위해 추가로 몇가지 패키지를 설치해 준다. pip install bert-extractive-su..
- Total
- Today
- Yesterday
- 파이썬
- GNN
- openCV기초
- kernal error
- Siamese Networks
- BERT
- deep learning
- pytorch
- 윈도우
- unique value
- np.ma.maked_where()
- Extrative_Summarisation
- anaconda3
- 오토인코더
- Graph Neural Networks
- 티스토리 코드 폰트
- 그래프
- 폰트 사이즈 변경
- np.tri()
- 재부팅
- Python
- 파이토치
- 논문구현
- Summarisation
- 주피터노트북
- NLP
- 샴네트워크
- 딥러닝
- ord()
- 합성곱
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |