2주차 학습일지
엑셀
1. 표시 형식 : 데이터를 어떤 형태로 표시할지 설정
- 범위 선택 후 Ctrl + 1 -> 셀 서식창
- 사용자 지정 기호
기호 | 의미 | 예시 |
# | 숫자(의미 없는 0 생략) | 001 -> ### -> 1 0 -> # -> (빈칸) |
0 | 숫자(의미 없는 0 표시) | 001 -> 000 -> 001 0 -> 0 -> 0 |
@ | 문자 | 고객 -> @"님" -> 고객님 |
, | 숫자의 중간 : 1000단위 마다 쉼표 숫자의 끝 : 1000단위 반올림 |
1000500 -> #,##0 -> 1,000,500 1000500 -> #, -> 1001 |
- 사용자 지정 구문
2. VLOOKUP 함수 : 공통 열을 기준으로 n번째 있는 데이터를 불러오는 함수
- 팁1 : 3번째 인수를 손으로 일일이 입력할 필요 없이 match 함수를 활용
- MATCH 함수 : 찾고 싶은 값이 한 행/열에서 몇 번째에 있는지 숫자로 알려줌
- 팁2 : 기준 열에 중복값이 있을 경우 중복값이 없는 새로운 기준 열을 생성하여 VLOOKUP 사용
3. INDEX 함수 : 특정 범위에서 행 번호와 열 번호로 원하는 데이터를 불러옴
- 두 번째, 세번째 인수에 MATCH 함수를 활용하면 r기준열 왼쪽에 위치한 데이터는 불러올 수 없는 VLOOKUP 함수의 한계 극복 가능
4. COUNT 함수 : 숫자데이터의 개수 파악
5. COUNTA 함수 : 비어있지 않은 셀의 개수 파악
5. COUNTBLANK 함수 : 비어있는 셀의 개수 파악
6. COUNTIFS 함수 : 특정 범위에서 모든 조건을 만족하는 셀의 개수 파악 (인수 : 값 범위, 조건 범위1, 조건1, 조건범위2, 조건2 ... )
7. SUMIFS 함수 : 모든 조건을 만족하는 데이터의 합계 계산
8. FIND 함수 : 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력 (대소문자 구분하지 않을 때는 SEARCH 함수 사용)
- 키워드 분석에 활용 가능 ( 강의자료 p.141 )
9. 데이터탭의 텍스트 나누기 기능 : 복붙 후 이용
10. 필터 단축키 : ctrl + shift + L
11. 데이터탭의 고급필터
12. 데이터 유효성 검사로 목록 만들기
데이터 분석 / 모델링
1. p-value(유의확률) : 귀무 가설이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 '같거나 더 극단적인' 통계치가 관측될 확률
- 귀무가설인 모집단의 평균이 100kg이 맞다는 전제 하에 표본의 평균이 30kg(150kg)이 나오거나 30kg(150kg) 보다 극단적인 평균이 나올 확률을 p-value 라고 함 (정말.. 이마를 탁치게 되는 설명과 예시였다)
2. t - test 의 시행 단계 : 적합한 t-test 방법을 선택하기 위한 F 검정 필요
- F-검정 : 두 집단의 분산에 통계적으로 유의미한 차이가 있는지를 검정
- 두 집단의 분산 차이를 검정해 각 상황에 맞는 t - test 방법을 선정하기 위해 사용
- 귀무가설 : 두 집단의 분산에 유의미한 차이가 없다. ( p > 유의수준 ) -> 등분산 가정 t - test
- 대립가설 : 두 집단의 분산에 유의미한 차이가 있다. ( p < 유의수준 ) -> 이분산 가정 t - test
3. 시계열 데이터 분석
- 정상성을 가지고 있는 정상 시계열 테이터와 그 반대인 비정상 시계열 데이터로 구분
- 정상성 : 추세나 계절성을 가지고 있지 않으며, 관측된 시간에 무관한 성질
- 대부분의 시계열 데이터는 비정상 시계열 데이터인데, 비정상 시계열 데이터인 상태로는 분석이 어렵기 때문에
차분이나 다른 방법을 활용해 비정상 시계열 데이터를 정상 시계열 데이터로 변환해 분석하기도 함 - 지수평활법 : 현재 시점에 가까운 시계열 자료에 큰 가중치를 주고, 과거 시계열 데이터일수록 작은 가중치를 주어 미래 시계열 데이터를 예측하는 기법
- FORECAST.ETS : 엑셀에서 사용할 수 있는 지수 평활법 관련 예측 함수로 비교적 뚜렷한 계절성이 있는 데이터 예측에 사용할 수 있음
데이터 시각화
1. 콤보형 차트 : 2개 이상의 정보를 표현하는 그래프 (보통 막대 + 꺾은선형)
- 데이터 범위 선택 → [막대형 차트]삽입 → 그래프의 막대 선택 → 마우스 오른쪽 클릭 → [계열 차트 종류 변경] → 차트를 변경할 계열의 차트 변경 → 필요한 경우 [보조 축] 선택
2. 거품형 차트 : 숫자의 크기나 비율을 거품으로 나타내는 차트로, 거품의 위치와 거품의 크기, 거품의 색 등을 활용해 정보를 표현
3. 폭포형 차트 : 데이터의 증가, 감소분 만큼을 막대 그래프로 표현
4. 조건부 서식