레이블이 computer_science인 게시물을 표시합니다. 모든 게시물 표시
레이블이 computer_science인 게시물을 표시합니다. 모든 게시물 표시

2023년 3월 28일 화요일

Ubuntu 한글 깨짐 문제 해결

 

apt-get -y install language-pack-ko

apt-get update

locale-gen ko_KR.UTF-8

dpkg-reconfigure locales

번호 선택

export LANGUAGE=ko_KR.UTF-8
export LANG=ko_KR.UTF-8

우분투(Ubuntu) 한글 깨짐 (tistory.com)

2020년 11월 2일 월요일

공공 데이터 활용(tmp)

정부

공공 데이터 제공(www.data.go.kr)

교육, 행정, 고용, 문화 등 다양한 데이터 제공을 위한 오픈 API 제공


공공기관

- 수많은 공공데이터 중 AI를 위한 기계학습 가능 데이터 극히 일부

- 각 공공 기관에서 수집, 보관 중인 데이터의 일부 제공


문제점

-낮은 정확성(32.1%), 갱신 문제(31.7%), 개방표준 관련 문제(30.6%), 양 부족(27.3%)


방안

데이터3법 시행 안정화

데이터 보안 철저

우수사례 공유, 고성능 컴퓨팅 자원, 데이터 처리 교육, 데이터 공유 인센티브

수요자 중심의 데이터셋 


데이터를 어떻게 관리하고 어떻게 활용해야 할까에 대한 해답을 찾는 것이 빅데이터의 역할


데이터 3법


  • 2020년 1월 9일 국회는 본회의를 개최하고 데이터 3법(개인정보호법, 정보통신망법, 신용정보법 개정안)을 통과
  • 데이터 3법은 개인정보보호법, 정보통신망법, 신용정보법 등 데이터 이용을 활성화하는 3가지 법률을 통칭
  • 기업들이 데이터 경제를 추진하고 발전시키는 데 발판
  • 미래의 데이터 먹거리를 키우는 데 필수적

  • 개인정보보호법 개정안 주요 내용
    • 가명정보 데이터 서비스 개발에 활용 가능
    • 개인정보 보호 기관 개인정보보호위로 일원화
  • 정보통신망법 개정안 주요 내용
    • 가명정보 금융분야 빅데이터 분석에 이용 가능
    • 가명정보 주체 동의 없이 활용 가능
  • 신용정보법 개정안 주요 내용
    • 온라인상 개인정보 감독 기능 개인정보보호위로 이관

장점
  • 마이 데이터를 통하여 새로운 형태의 서비스를 제공받을 수 있음
  • 기술발전: 가명정보를 이용하여 기업과 연구기관들이 AI나 자율주행 자동차의 연구개발에 박차

단점
  • 부당한 개인정보 노출
    • 여러가지 가명정보를 결합할 경우에는 특정 개인을 특정가능 하며, 우리나라의 경우 주민등록 번호, 의료 기록등 모두 전산화 되어 있어 노출될 경우 파장이 큼
  • 개인정보의 소유권 문제
    • 개인정보는 엄밀히 말하면 개인의 소유임. 기업이 어떤 가치 창출을 위해 개인의 소유물을 사용한다면 마땅히 그에 걸맞은 이익을 개인에게 제공해야 함
  • 정치적 남용

개인정보 보호 vs 공공의 이익

  • 현재 우리는 공공의 이익을 위해, 어느 정도의 개인정보를 양보해야 하는 디지털 시대에 살고 있음.
  • CCTV 혹은 공항에서의 짐 수색 등은 안전이라는 더 큰 가치와 공공 목표를 보호하기 위하여 개인의 자유와 권리를 양보하는 좋은 예임.


출처: https://www.dokdok.co/brief/nae-gaeinjeongboyi-mirae-deiteo3beob-ihaehagi

2018년 4월 19일 목요일

이진 검색 (백준 2110, 공유기 설치)

  • Binary Search와 Parametric search의 개념을 까먹어서 다시 공부했음. 두 개념을 잘 설명하는 블로그를 링크함.
  • 깨달은 점
    • 이 문제는 최대 인접 거리를 이진 검색해야 함. 단순히 집의 좌표를 이진 검색하는 것이 아님.
    • 이진 검색의 대상은 미리 정렬이 되어있어야 함.
  • 코드

2018년 4월 1일 일요일

재귀호출 문제(백준 1914, 하노이의 탑)

  • 문제 출처: https://www.acmicpc.net/problem/1914
  • 문제 이름: 하노이의 탑
  • 탑의 갯수가 적을 때는 재귀호출 방식으로 풀어야 하지만, 탑의 갯수가 많은 경우 시간초과가 발생함. 따라서 탑의 갯수가 N이라면, N개의 탑을 모두 옮기는데 2^N -1 개가 걸림을 알 수 있음. 중요한 것은 2^100만 하더라도 숫자가 엄청 커짐. 따라서 Long 타입도 handle할 수 없음. 따라서 BigInteger 클래스를 사용함.
  •  

2018년 3월 28일 수요일

Dynamic Programming 복습2 (백준 2011번, 암호코드)

출처
https://www.acmicpc.net/problem/2011
 
문제



변수 설명
- n: 각 digit이 저장되어 있는 int array .
- dp: 암호의 각 자리 수까지 나올 수 있는 해석의 수를 저장하는 array(암호가 없을 때도 추가 했기 때문에 index의 length는 n.length +1임.

점화식 설명
- 암호가 한 자리일 때와 두 자리일 때를 구분해야 함.
- 암호가 '1'부터 시작하기 때문에 '0'일 때는 '암호 한 자리'일 때를 적용할 수 없음. digit이 '0' 아닐 때만, 암호해석의 경우의 수를 +1 해줌. (dp[i] = dp[i-1])
- 암호가 두 자리일 경우는, 두자리를 읽었을 때 그 수가 10 이상 26이하여야 함. 그 조건에 만족하면 그 두자리를 읽기 전까지의 암호해석 수에 한 자리로 암호 해석을 하는 경우의 수를 더해 주어야 함. ( dp[i] = dp[i-2] + dp[i])
- 선제 조건: dp[0] = 1. dp[1] = 1 ( 암호가 없을 경우와 첫번째 암호 digit을 읽었을 경우는 각각 암호 해독 방법이 1가지 씩 임)

코드
- bottom-up으로 풀었음.