본문 바로가기

AI_학습노트

(25)
_06.[Python Tip]딕셔너리 tip2가지 원문보기: https://betterprogramming.pub/too-many-if-elif-conditions-in-python-use-dictionaries-instead-5486299af27e Too Many If-Elif Conditions in Python? Use Dictionaries Instead An unconventional way Python dictionaries can clean up your code betterprogramming.pub 1. 딕셔너리 key로 value를 호출할 때는 get() 메소드를 쓰는 습관이 좋다. keyError 처리를 할 수 있기 때문. 아래 딕셔너리의 키에러가 날 경우 출력문을 보면, get()함수를 사용하여 위와 같은 에러를 피하고 내부에 해당..
_06. 피어슨 상관 계수(Pearson correlation coefficient 또는 Pearson's r) 변수 사이의 선형 관계 조사(Pearson) 두 계량형 변수 사이의 선형 관계의 강도와 방향을 조사하려면 Pearson 상관 계수를 사용합니다. 강도 상관 계수 값의 범위는 −1부터 +1까지입니다. 계수의 절대값이 클수록 변수 사이에 강한 관계가 있습니다. Pearson 상관의 경우 절대값 1은 완전한 선형 관계를 나타냅니다. 0에 가까운 상관 값은 변수 사이에 선형 관계가 없음을 나타냅니다. 방향 계수의 부호는 관계의 방향을 나타냅니다. 두 변수가 함께 증가하거나 감소하는 경향이 있으면 계수가 양수이며, 상관을 나타내는 선이 위쪽 방향으로 기울어집니다. 한 변수가 증가할 때 다른 변수는 감소하는 경향이 있으면 계수는 음수이며, 상관을 나타내는 선이 아래쪽 방향으로 기울어집니다. 다음 그림은 변수 사이 ..
_05.KDE (커널밀도추정: Kernel Density Estimation) 이유한님 타이타닉 EDA 과제: KDE가 무엇인지 공부해 보자!!!! 내가 이해한 KDE: 바(bar)챠트보다 직관적으로 두 데이터의 분포도로 비교분석할 수 있다. 어떤 변수가 가질 수 있는 값 또는 그 값을 가질 가능성의 정도를 추정하는 것으로 밀도 분포도를 그려주는 plot을 kdeplot이라고 한다. *자세한 설명 링크: 링크[1]: KDE 이해 링크[2]: 그래프 이해
_05.힙(Heap) 구조 힙(heap)은 트리구조 중의 하나로, '우선순위 큐(priority queue)를 구현할 때 사용됩니다. 우선 순위 큐는 데이터 구조의 하나로 데이터를 자유롭게 추가할 수 있습니다. 먼저, 우선순위에 대하여 살펴보겠습니다. 우선순위 큐(priority Queue) 우선 순위 큐는 우선 순위가 가장 높은 데이터를 가장 먼저 삭제하는 자료구조 입니다. 우선 순위 큐는 데이터를 우선 순위에 따라 처리하고 싶을 때 사용합니다. 예) 물건 데이터를 자료구조에 넣었다가 가치가 높은 물건부터 꺼내서 확인해야 하는 경우 자료구조 추출되는 데이터 스택(Stack) 가장 나중에 삽인된 데이터 큐(Queue) 가장 먼저 삽입된 데이터 우선순위 큐(Priority Queue) 가장 우선순위가 높은 데이터 우선 순위 큐를 구..
_04. 해시테이블 알고리즘 도감과 파이썬 기초& 알고리즘 사고법을 기반으로 작성된 내용입니다. 해시 테이블(hash table)은 자료구조의 하나입니다. 해시함수와 함께 데이터 검색을 효율적으로 하기 위해 사용되는 구조입니다. 장점: 해시테이블은 해시 함수를 이용해서 배열 내의 특정 데이터에 빠르게 접근할 수 있습니다. 해시값이 충돌할 때는 리스트를 사용하고 있어서 저장할 수 있는 데이터 수가 정해져 있지 않더라도 유연하게 대응할 수 있습니다. 단점: 해시 테이블에 사용하는 배열의 크기가 너무 작으면 충돌이 많아지고 선형 탬색의 빈도가 높아지게 됩니다. 반대로 크기가 너무 크면 데이터가 없는 상자가 너무 많아져서 메모리를 낭비하게 됩니다. 따라서 배열의 크기를 적절히 설정하는 것이 중요합니다. 무슨 말인지 하나하나 알아볼..
_04.[관련용어]빅오 표기법 빅오 표기법의 종류 1. O(1) 입력값이 아무리 커도 실행 시간은 일정합니다. O(1)에 시행되는 알고리즘으로 해시 테이블의 조회 및 삽입이 이에 해당합니다. 2. O(logn) 실행 시간이 입력값에 영향을 받습니다. 그러나 로그는 매우 큰 입력값에도 크게 영향을 받지 않는 편으로 웬만한 n의 크기에 대해서도 매우 견고합니다. 대표적으로 이진 검색이 이에 해당합니다. 3. O(n) 입력값만큼 실행 시간에 영향을 받으며, 알고리즘을 수행하는 데 걸리는 시간은 입력값이 비례합니다. 이러한 알고리즘을 선형 시간 알고리즘이라고 합니다. 정렬되지 않은 리스트에서 최댓값 또는 최솟값 경우가 이에 해당하며 이 값을 찾기 위해서는 모든 입력값을 적어도 한 번 이상은 살펴봐야 합니다. 4. O(n logn) 병합 정렬..
_03. coma반 수업 노트필기_Part2 파이썬 기본 수업이 끝나고, 자료구조로 넘어온지 2주차이다. 파이썬 코딩을 매일 해도 모자랄 판에, 수업 날만 빼꼼히 들여다본다. 6개월을 매일 열심히 달린다는 것 자체가 잘못된 목표였다며.. 2달을 마감하며 나 자신과 타협을 했다. 나는 지구력이 약해서 장기 프로젝트는 늘 어렵다. 짧게는 2~3일, 길게는 3개월이 내게는 딱 이루기 좋은 기간이다. 에이펠의 6개월은 나에게 여러모로 시험을 통과하는 기분이 들게 한다. 6개월을 가려면 잠시 속도를 늦춰보자. 인생은 속도보다 방향이렷다. 이런 말은 필요할 때 가져다 쓰라고 있는 거니까.. 오늘 너의 필요를 끌어와 보련다. Part2. [자료구조]01. 배열/스택/큐 (2/24) [자료구조]02. 링크드 리스트 (3/03) [자료구조]03. 해쉬테이블 (3/..
_03.Normalization/ Standardization/Regularization? [자료퍼옴][realblack0.github.io/2020/03/29/normalization-standardization-regularization.html] 딥러닝을 공부하다 보면 “정규화” 라는 용어를 참 자주 접하게 된다. 그런데 애석하게도 Normalization, Standardization, Regularization 이 세 용어가 모두 한국어로 정규화라고 번역된다. 이 세가지 용어가 다름을 알고 난 뒤로부터 가능한 딥러닝 용어들을 한글이 아닌 영어로 쓰려고 하고 있다. 매번 헷갈리는 Normalization, Standardization, Regularization의 차이에 대해서 간략히 정리해둔다. Normalization 값의 범위(scale)를 0~1 사이의 값으로 바꾸는 것 학습 전..