카테고리 없음

2주차 학습일지

dulcetsay 2024. 2. 29. 19:24

엑셀

1. 표시 형식 : 데이터를 어떤 형태로 표시할지 설정

  • 범위 선택 후 Ctrl + 1 -> 셀 서식창
  • 사용자 지정 기호
기호 의미 예시
# 숫자(의미 없는 0 생략) 001 -> ### -> 1
0 -> # -> (빈칸)
0 숫자(의미 없는 0 표시) 001 -> 000 -> 001
0 -> 0 -> 0
@ 문자 고객 -> @"님" -> 고객님
, 숫자의 중간 : 1000단위 마다 쉼표
숫자의 끝 : 1000단위 반올림
1000500 -> #,##0 -> 1,000,500
1000500 -> #, -> 1001

 

  • 사용자 지정 구문

 

2. VLOOKUP 함수 : 공통 열을 기준으로 n번째 있는 데이터를 불러오는 함수

  • 팁1 : 3번째 인수를 손으로 일일이 입력할 필요 없이 match 함수를 활용
  • MATCH 함수 : 찾고 싶은 값이 한 행/열에서 몇 번째에 있는지 숫자로 알려줌

  • 팁2 : 기준 열에 중복값이 있을 경우 중복값이 없는 새로운 기준 열을 생성하여 VLOOKUP 사용

3. INDEX 함수 : 특정 범위에서 행 번호와 열 번호로 원하는 데이터를 불러옴

  • 두 번째, 세번째 인수에 MATCH 함수를 활용하면 r기준열 왼쪽에 위치한 데이터는 불러올 수 없는 VLOOKUP 함수의 한계 극복 가능

 

4. COUNT 함수 : 숫자데이터의 개수 파악

5. COUNTA 함수 : 비어있지 않은 셀의 개수 파악

5. COUNTBLANK 함수 : 비어있는 셀의 개수 파악

6. COUNTIFS 함수 : 특정 범위에서 모든 조건을 만족하는 셀의 개수 파악 (인수 : 값 범위, 조건 범위1, 조건1, 조건범위2, 조건2 ... )

7. SUMIFS 함수 : 모든 조건을 만족하는 데이터의 합계 계산

8. FIND 함수 : 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력 (대소문자 구분하지 않을 때는 SEARCH 함수 사용)

  • 키워드 분석에 활용 가능 ( 강의자료 p.141 )

 

9. 데이터탭의 텍스트 나누기 기능 : 복붙 후 이용

 

10. 필터 단축키 : ctrl + shift + L

 

11. 데이터탭의 고급필터

 

12. 데이터 유효성 검사로 목록 만들기

 

 

데이터 분석 / 모델링

1. p-value(유의확률) : 귀무 가설이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 '같거나 더 극단적인' 통계치가 관측될 확률

  • 귀무가설인 모집단의 평균이 100kg이 맞다는 전제 하에 표본의 평균이 30kg(150kg)이 나오거나 30kg(150kg) 보다 극단적인 평균이 나올 확률을 p-value 라고 함 (정말.. 이마를 탁치게 되는 설명과 예시였다)

2. t - test 의 시행 단계 : 적합한 t-test 방법을 선택하기 위한 F 검정 필요

  • F-검정 : 두 집단의 분산에 통계적으로 유의미한 차이가 있는지를 검정
    - 두 집단의 분산 차이를 검정해 각 상황에 맞는 t - test 방법을 선정하기 위해 사용
    - 귀무가설 : 두 집단의 분산에 유의미한 차이가 없다. ( p > 유의수준 ) -> 등분산 가정 t - test
    - 대립가설 : 두 집단의 분산에 유의미한 차이가 있다. ( p < 유의수준 ) -> 이분산 가정 t - test

3. 시계열 데이터 분석

  • 정상성을 가지고 있는 정상 시계열 테이터와 그 반대인 비정상 시계열 데이터로 구분
    - 정상성 : 추세나 계절성을 가지고 있지 않으며, 관측된 시간에 무관한 성질

  • 대부분의 시계열 데이터는 비정상 시계열 데이터인데, 비정상 시계열 데이터인 상태로는 분석이 어렵기 때문에
    차분이나 다른 방법을 활용해 비정상 시계열 데이터를 정상 시계열 데이터로 변환해 분석하기도 함
  • 지수평활법 : 현재 시점에 가까운 시계열 자료에 큰 가중치를 주고, 과거 시계열 데이터일수록 작은 가중치를 주어 미래 시계열 데이터를 예측하는 기법
    - FORECAST.ETS : 엑셀에서 사용할 수 있는 지수 평활법 관련 예측 함수로 비교적 뚜렷한 계절성이 있는 데이터 예측에 사용할 수 있음

 

 

데이터 시각화

1. 콤보형 차트 : 2개 이상의 정보를 표현하는 그래프 (보통 막대 + 꺾은선형)

  • 데이터 범위 선택 → [막대형 차트]삽입 → 그래프의 막대 선택 → 마우스 오른쪽 클릭 → [계열 차트 종류 변경]  →  차트를 변경할 계열의 차트 변경 → 필요한 경우 [보조 축] 선택

2. 거품형 차트 : 숫자의 크기나 비율을 거품으로 나타내는 차트로, 거품의 위치와 거품의 크기, 거품의 색 등을 활용해 정보를 표현

3. 폭포형 차트 : 데이터의 증가, 감소분 만큼을 막대 그래프로 표현

콤보 / 거품 / 폭포

4. 조건부 서식