목록통계 (4)
Joonas' Note
배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 정말 영어가 많아졌는가? 마침 1964년부터 2023년까지 60년의 데이터가 쌓였고, 결론부터 말하자면 영어 비중은 많아졌다. 2023년에 들어서는 영어 가사의 비중이 25% 를 넘을 정도로 많아졌고, 최근에 사람들이 이런 사실을 체감하는 이유는 2011년 이후로 10년만에 영어 비율이 더 커지고 있기 때문으로 보인다. 영어 비중은 2008~2012년 사이에 잠시 상승하고 그 뒤로는 ..
사실 블로그에 개발과 관련한 글을 올리는 건 2014년 구글 블로그를 시작으로 알고리즘 문제 풀이를 간단하게 올렸었다. Google Blogger 플랫폼 자체에 업데이트가 별로 없고, 자체적으로 통계를 내어주는 서비스도 없었다. (Google Analytics 스크립트를 별도로 삽입하면 가능) 그 외에도 여러 이유로 2017년 12월에 티스토리로 옮겼는 데, 정확한 이유는 기억이 나질 않는다. 2023년 6월 현재를 기준으로, 이제는 Google Blogger에 작성했던 170개의 글보다, 이 곳 티스토리 블로그에서 작성한 글이 220개로 더 많다. 최근 블로그에 유입하는 키워드나 내가 다루는 관심 주제들의 변화도 있었지만 블로그의 통계를 기록으로 남기는 것도 좋을 것 같아서 이렇게 포스팅을 한다. 먼저..
문득 그런 생각이 들었다. 사람들이 자신의 자동차 번호판을 고를 때, 외우기 쉬운 배열을 많이 고르지 않을까? 그럼, 숫자가 겹치면 외우기 쉬우니까 그런 차량이 많이 있으려나? 위는 근거 없는 추측일뿐이지만, 실제로 도로 위에서 숫자가 겹치는 번호판은 정말 많다. 그럼 정말로 도로 위의 차량 중에서 숫자가 겹치는 번호판을 만날 확률은 얼마나 될까? 먼저 번호판은 0 으로 시작하지 않으므로, 1000 부터 9999 까지 등장할 수 있다. 그럼 뒤 4자리(XX가 YYYY 중에서 YYYY)가 겹칠 확률만 계산해보자. def collide(n): a = {} for i in n: if i in a: return 1 a[i] = 1 return 0 cnt = 0 s = 0 for i in range(1000, 1..