윈집 무료 다운로드 사용법 설치 - WinZip
페이지 정보
작성자 Mana 댓글 0건 조회 1회 작성일 25-04-06 08:07본문
두산백과에 윈집 무료 다운로드 - WinZip 있는 IT 소프트웨어 용어 275개를 정리해보았습니다.하드웨어 용어는 여기에서 확인하실 수 있습니다.각 용어에 대한 설명, 자료의 출처는 개별 링크로 걸어뒀으며,모든 저작권은 두산백과에 있습니다.소셜 로봇 [Social Robot]사람이 사용하는 언어로 대화하면서 상황에 맞는 행동을 자율적으로 수행하는 로봇. 사람과의 대화를 통해 교감할 수 있는 자율 로봇을 가리킨다. 언어나 몸짓을 통해 사회적 행동을 할 수 있다는 점에서 '소셜(Social)'이라는 단어가 붙었다. 과거에는 유사한 의미의 '감성 로봇(Emotional Robot)'이라는 용어가 통용되었으나, 1997년 오드 빌라(Aude Billard)와 커스틴 도텐한(Kerstin Dautenhahn)의 논문에서 '소셜 로봇'이라는 표현이 소개되면서 현재는 두 용어가 혼용된다. 국제로봇협회(International Fedration of Robotics, IFR)에서 제시한 용도에 따른 로봇 구분에 의하면, 소셜로봇은 '서비스 로봇'범주에 해당한다. 특히 거동이 불편한 사람을 도와주거나 정서적인 교감이 필요한 사람들과 소통하는 등 개인을 지원하는 용도로 주로 활용되고 있다는 점에서 '개인용 서비스 로봇'으로 분류되기도 한다. [소셜 로봇의 유형] 용도에 따라서 다음과 같이 구분할...웹 서비스 [Web Service]웹 표준을 기반으로 네트워크상의 기계간 상호작용을 통해 다양한 서비스를 제공할 수 있도록 설계된 시스템. 인터넷상의 정보를 교환하기 위한 월드와이드웹(WWW, World Wide Web)과 혼동하기 쉬우나, 월드 와이드 웹은 HTTP를 기반으로 HTML 형식으로 되어 있는 문서를 통해 사용자에게 정보를 제공하기 위한 서비스인 반면, 웹 서비스는 컴퓨터와 같은 기기와 기기 간의 커뮤니케이션을 위한 서비스이다. 주로 인터넷 환경에서 웹 표준을 통해 제공되도록 구현하며, 웹에 연결된 기기로부터 다양한 형태의 데이터를 주고받는다. [웹 서비스 주요 특징] 표준화된 형식을 이용해서 서로 다른 기기간의 커뮤니케이션이 가능하다는 점에서 높은 상호 운용성과 확장성을 가진다. 프로세스를 단순화하여 복잡한 작업을 간결하게 처리하고 서비스 간에 종속성을 줄이기 위해 '느슨하게 결합된 방식(Loosely Coupled)'으로 되어 있다. 단순하고 확장성 있는 교환 메시지를 통해 기존 웹...도커 [Docker]LXC(LinuX Containers)로 불리는 리눅스 컨테이너를 기반으로 가상의 컨테이너 배포 자동화를 지원하기 위해 개발된 오픈소스 소프트웨어. 단일 호스트(Single Host)상에 여러 개의 컨테이너(Containers)를 실행할 수 있도록 운영체제(OS, Operating System) 레벨에서 가상화(Virtualization)를 지원하기 위한 오픈소스 소프트웨어이다. 컨테이너란 컴퓨터 운영체제와는 별개의 환경에서 프로세스를 독립적으로 실행시키기 위한 패키지로, 이러한 컨테이너 배포를 용이하게 하고 자동화를 지원하기 위한 도구가 도커이며, 이와 유사한 컨테이너 배포 도구로 구글(Google)에서 시작한 오픈소스 프로젝트인 쿠버네티스(Kubernetes)가 있다. 이전에도 유사한 기술은 연구되어 왔으나 도커가 등장함으로써 컨테이너 가상화에 대한 기술이 본격적으로 확산되기 시작하였다. 특히 인터넷 초기에는 서비스 이용량이 많지 않아 콘텐츠 제공에 사용되는 서버의 확장에 무리가...지식 그래프 학습 [Knowledge Graph Learning]개체와 관계로 구성된 지식 그래프 데이터를 다루는 기계 학습 분야. 지식 그래프 학습은 지식 그래프(Knowledge Graph) 형태의 데이터를 다루는 기계 학습의 한 분야이다. 지식 그래프는 주로 개체(Entity)와 관계(Relation)로 구성되는데, 이를 통해 개체 간 상호작용과 관계의 임베딩을 벡터로 표현하고, 이를 통해 지식 그래프를 더 깊게 이해하고 확장하는 것을 목표로 한다. 지식 그래프는 시맨틱(의미론적인) 정보 체계를 그래프로 나타낸 것이다. 각각의 개체는 그래프의 점으로 나타내고, 개체들 간의 관계를 선으로 나타낸다. 예를 들어 ‘서울은 한국의 수도’ 라는 지식을 표현하려면, ‘서울’과 ‘한국’ 개체를 ‘A가 B의 수도’라는 의미로 연결하여 나타낼 수 있으며, (서울, 한국, 수도)와 같은 형태로 표현한다. 이와 같이 (개체, 개체, 관계)의 관계로 표현하는 형태를 트리플렛(Triplet)이라고 한다. 대표적인 지식 그래프는 약 60만 개의 트리플렛으로 구성된 FB15k...어텐션 [Attention]딥 러닝에서 데이터의 특정 부분에 집중하기 위한 메커니즘, 혹은 그 과정에서 산출되는 값. 어텐션은 딥 러닝의 중간 단계에서, 출력 성능을 향상시키기 위해 주어지는 입력들 중 특정 측면에 집중하는 메커니즘, 또는 그 과정에서 산출되는 값을 말한다. 어텐션에서 집중의 비중은 숫자로 계산되는데 이 값 자체를 어텐션이라고도 부른다. 어텐션은 딥 러닝 분야에서 매우 핵심적인 메커니즘으로 사용되고 있다. 이미지를 분류하기 위해 레이블의 특징이 나타나 있는 특정 부분에 집중하거나, 문장을 긍정/부정으로 분류하기 위해 특정 단어에 집중하는 등의 다양한 문제에서 효과적으로 쓰일 수 있다. 또한, 모델의 중간 결과에서 어텐션을 추출하여 열지도(heat map)와 같은 형식으로 시각화하면, 모델이 계산하는 과정에서 데이터의 어느 부분에 집중하였는지를 확인할 수 있다. 이는 설명가능한 인공지능(XAI)의 주요 요소로도 사용된다. 최초의 어텐션은 피드-포워드 신경망(FFNN)이나...노드닷제이에스 [Node.js]웹 서버에서 동작하는 응용프로그램 개발을 위해 만들어진 확장성 있는 자바스크립트(JavaScript) 기반의 소프트웨어 플랫폼. 확장성 있는 네트워크 서버사이드 애플리케이션 개발에 사용되는 자바스크립트 기반의 개발 플랫폼이다. 플랫폼에 독립적이어서 마이크로소프트 윈도우(Microsoft Windows), 리눅스(Linux), 애플 맥(Apple Mac) 등 다양한 플랫폼에서 실행되며, 서버 측면에서 자바스크립트를 사용해서 개발할 수 있게 지원한다. 기존에는 주로 클라이언트쪽 개발은 HTML에 포함된 형태의 자바스크립트를 사용하고, 서버쪽 개발은 PHP(Hypertext Preprocessor), ASP(Active Server Pages), JSP(Java Server Page)와 같은 서버사이드 언어를 사용하였다. 하지만 노드닷제이에스의 등장으로 HTML에 포함되는 형태로 클라이언트 측면의 개발에 주로 사용되던 자바스크립트의 영역이 서버쪽으로 확대되어, 자바스크립트 하나만으로도 클라이언트와 서버 양쪽의...지능형 에이전트 [intelligent agent]사람을 대신해서 정보를 수집하거나 특정한 목적을 수행하는 지능형 자율 프로그램. 스스로 주변 환경을 탐지하고 파악하여 사람의 업무를 대신해서 자율적으로 수행하는 컴퓨터 시스템이나 로봇 등을 총칭하는 용어이다. 사람을 대신하던 자율 소프트웨어에 인공지능이 더해져서 지능형 에이전트로 불린다. 컴퓨터가 스스로 판단하고 인지해서 주변 환경과 상호 작용하며 사람이 수행하는 반복적이거나 복잡한 업무를 자동화 시켜서 원하는 목적을 달성할 수 있게 지원한다. [지능형 에이전트 주요 특징] 스스로 판단하거나 동작할 수 있는 자율성(Autonomy)을 가지고 있어 주변 환경이나 상황에 대해 적절하게 판단 및 제어한다. 다른 컴퓨터 에이전트와의 통신을 통한 상호작용이 가능하며 주어진 상황이나 변화에 대해 사용자의 개입 없이도 사전에 정해놓은 목표에 따라 능동적(Proactivity)으로 동작한다. 목표 달성을 위해서는 지속적이고 일관성 있게 움직이며 주어진 상황에 대해...jQuery웹사이트 개발 시 클라이언트 측면의 스크립트 언어를 쉽게 활용할 수 있게 지원하는 자바스크립트 라이브러리. 웹사이트 개발에 사용되는 자바스크립트 라이브러리 중 하나이다. 오픈소스 형태로 개발 및 배포되어 누구나 쉽게 활용할 수 있다. 2000년대 중반 존 레식(John Resig)에 의해 개발된 라이브러리를 기반으로 하고 있으며, 당시 웹사이트 개발에 큰 이슈 중 하나였던 브라우저 호환성을 대부분 해결하였다. 다양한 브라우저에서 지원될 뿐만 아니라 여러 가지 편리한 함수를 지원하기 때문에 많이 사용되었으나, 최근에는 서버와의 연결을 최소화하는 방식인 SPA(Single Page Application) 개발이 늘어남에 따라 뷰(Vue.js)나 리액트(React.js) 와 같은 라이브러리 사용이 점차 늘어나는 추세이다. [jQuery 특징] 라이브러리 형태로 개발되어 있어 적은 양의 코드로 원하는 기능을 쉽게 구현할 수 있으며, 다양한 함수를 제공하고 있어 쉽게 원하는 기능을 제어할 수 있다....자바스크립트 [JavaScript]웹 사이트 개발 시 특정 이벤트나 동적 처리 등을 지원하기 위한 목적으로 사용하는 스크립트 언어. 웹 사이트 개발에서 가장 많이 사용하는 스크립트 언어 중 하나이다. 썬 마이크로시스템즈(Sun Microsystems)에서 개발한 자바(JAVA)와 이름이 비슷하지만 두 가지는 전혀 다른 별개의 언어이다. 1990년대 중반 미국의 넷스케이프 커뮤니케이션즈(Netscape Communications)에 의해 개발된 이후에 지금까지도 대표적인 스크립트 언어로 자리매김하고 있다. 대표적인 웹 사이트 개발 언어인 HTML(HyperText Markup Language Version) 문서 내에 삽입되어 클릭 이벤트나 웹 페이지의 속성을 제어하기 위한 인터페이스인 DOM 방식으로 HTML 속성들을 제어한다. [자바스크립트 특징] 대소문자를 엄격하게 구분하며, 인터프리터 방식이라 컴파일 과정 없이 바로 실행된다. 상대적으로 실행속도는 느리나 개발 수정이 용이하고, 객체를 중심으로 함수 단위로 구성되어 있어...비둘기집의 원리 [The Pigeonhole Principle]물건의 개수보다 적은 상자에 물건을 넣을 경우, 적어도 하나의 상자에는 두 개 이상의 물건이 들어간다는 조합론의 기본 원리로, 명제 증명에 주로 사용된다. 비둘기집의 원리는 간명하지만 강력한 조합론의 기본 원리로, n개의 비둘기집에 n+1 마리의 비둘기가 들어갈 때, 적어도 하나의 비둘기집에는 두 마리 이상의 비둘기가 들어가게 된다는 원리이다. 수 체계의 명제를 증명하는 데 자주 활용했던 독일의 수학자 페터 디리클레의 이름을 따 ‘디리클레 상자 원리’라고도 부른다. 수식을 일반화하여, ‘n개의 물건을 m개의 상자에 담게 되면, 최소 하나의 상자는 n/m의 몫 이상의 물건이 담긴다’ 와 같이 정의하기도 한다. [비둘기집의 원리 증명] 비둘기집의 원리는 귀류법으로 증명할 수 있다. 만약 n개의 비둘기집에 n+1마리의 비둘기가 들어갔는데, 모든 비둘기집에 한 마리 이하의 비둘기가 들어 있다면, 비둘기의 총 수는 n마리를 넘을 수가 없으므로 모순이 성립하게 된다. 따라서 두 마리...객체 인식 [Object Detection]그림이나 영상 데이터에서 물체를 감지하는 컴퓨터 비전의 핵심 기술 중 하나. 객체 인식은 컴퓨터 비전의 핵심 기술 중 하나로, 그림이나 영상 데이터를 인공지능에게 입력하여 다양한 객체를 식별하고 분류하도록 하는 기술이다. 이미지의 특정 공간에 객체가 있는지를 판별하는 객체 감지와 해당 객체가 무엇에 해당하는지를 판단하는 객체 분류로 나눌 수 있다. 객체 인식 기술은 자율주행 자동차, 이미지 검색 시스템과 같은 환경에서 필수적으로 사용되고 있다. [객체 감지와 객체 분류] 객체 감지 기술은 이미지에서 객체를 감지하고 그것의 위치나 크기를 식별하는 것을 의미한다. 2차원 이미지를 예로 들면, 객체 감지 기술은 객체의 형태를 이루는 경계선을 찾고, 이를 표시한다. 대표적인 방식으로는 상하좌우의 경계를 설정하여 직사각형으로 표시하는 경계 상자(Bounding box) 형식이 사용된다. 반면, 객체 분류는 주어진 이미지 혹은 이미지에서 추출된 객체의 데이터를 이용해 해당...모럴 머신 [Moral Machine]자율주행차의 도덕적 딜레마에 대한 상황을 제시하여 사용자의 응답을 조사한 플랫폼. 2016년 MIT에서 개발했다. 자율주행 자동차의 도덕적 딜레마를 제시하는 온라인 플랫폼으로, 2016년 MIT(메사추세츠공과대학)의 컴퓨터 과학자 이야드 라완과 미디어랩의 학생들이 개발하였다. 자율주행 자동차의 윤리에 대한 연구에 활용되고 있다. [모럴 머신 실험] 모럴 머신에 접속한 사용자들은 자율주행 차량의 충돌이 불가피한 상황에서 두 개의 해로운 결과 중 하나를 선택해야 한다. 예를 들면, 자율 주행 차량의 브레이크가 갑자기 고장났을 때, 횡단보도를 향하던 주행 방향을 바꿀 것인지의 여부를 선택하는 상황이 주어진다. 방향을 바꾸면 콘크리트 장벽에 충돌하여 5명의 승객이 죽게 되고, 방향을 바꾸지 않으면 횡단보도를 지나던 5명의 보행자를 충격하여 사망하게 되는 상황에서, 사용자는 두 판단 중 하나를 선택해야 한다. 문제의 상황은 성별, 직업, 나이, 교통 법규의 준수 여부, 종...퓨 샷 러닝 [Few-shot Learning]기계 학습에서 적은 데이터로 정확한 예측을 수행하는 방법에 대한 연구. 퓨 샷 러닝은 제한된 양의 데이터로 학습을 수행하는 기계 학습의 한 분류이다. 전통적인 기계 학습에서는 데이터와 레이블을 활용하여 데이터의 특징을 학습하는데, 이는 대규모 데이터의 레이블이 필수적으로 존재해야 하므로 실제 상황에서의 활용성이 떨어진다. 퓨 샷 러닝은 적은 데이터로도 기계 학습의 분류와 같은 문제의 성능을 높이는 것을 목표로 한다. 이는 데이터가 희귀하게 존재하거나 수집이 어려운 분야에서 효과적으로 활용될 수 있다. [퓨 샷 러닝 문제의 학습 ] 퓨 샷 러닝의 대표적인 문제는 ‘N-way K-shot’ 분류 문제로, N개 종류의 레이블에 대해 각각 K개의 데이터만이 주어질 때 이를 분류하는 문제다. 이를 효과적으로 학습하기 위해, 퓨 샷 러닝은 모델의 초기 가중치를 사전에 다른 데이터를 통해 학습시켜 새로운 문제에서도 좋은 성능을 얻는 방향으로 적용된다. 예를 들어, [사자, 코끼리...퍼셉트론 [Perceptron]인공 신경망을 구성하는 기본 단위로, 입력 신호에 가중치를 곱한 후 활성화 함수를 통해 출력 신호를 생성하는 알고리즘. 인공 신경망을 구성하는 기본 단위로, 1957년 프랑크 로젠블랏에 의해 처음으로 소개되었다. 여러 개의 수치형 데이터를 입력값으로 받아 각각의 입력에 가중치(Weight)를 곱하여 합산하고, 이를 활성화 함수(Activation Function)에 통과시켜 출력값을 생성한다. [퍼셉트론과 뉴런] 퍼셉트론의 작동 방식은 뇌의 신경 뉴런을 모방하여 설계되었다. 뇌의 뉴런에서는 여러 개의 입력 신호가 수상 돌기(Dendrites)를 통해 전달되면, 이를 통합하여 역치(Threshold) 이상의 신호가 되는 경우 새로운 신호가 축삭 돌기(axon)을 통해 다른 뉴런으로 전달되는데, 로젠블랏은 이 부분에 착안하여 수학적인 모델을 제시하였다. 퍼셉트론에서 각각의 입력 데이터는 뉴런의 입력 신호에 대응한다. 각 입력 데이터는 퍼셉트론에서 정의된 가중치와 곱해지며, 역치와 동일하게...설명가능한 인공지능 [Explainable AI]인공지능의 결정 과정을 이해하고 해석할 수 있는 방향으로 인공지능을 구현하거나 활용하는 기술을 말한다. 인공지능의 결정 과정을 이해하고 해석할 수 있는 방향으로 인공지능을 구현하거나 활용하는 기술로, 줄여서 ‘XAI’라고도 부른다. [블랙 박스 인공지능의 한계] 인공지능 모델은 여러 분야에서 인간의 의사 결정을 대체하고 있다. 인공지능 모델은 데이터의 분포와 특성을 효과적으로 학습하지만, 그 과정을 명확하게 파악하기 어려운 문제점이 있다. 이와 같이 전통적 인공지능 모델을 ‘블랙 박스(Black Box)’ 인공지능이라고 부르는데, 블랙 박스 인공지능은 의사 결정 과정이 표면으로 명확히 드러나지 않기 때문에 의료와 법률 분야와 같이 그 결정의 배경이 중요한 분야에서는 활용하기 어렵다. 이러한 블랙 박스 인공지능의 한계를 극복하기 위해, 설명가능한 인공지능이라는 개념이 등장하게 되었다. [설명가능한 인공지능의 목적 및 중요성] 설명가능한 인공지능은 작동...오토인코더 [Autoencoder]비지도 학습에서 사용되는 인공신경망 알고리즘으로, 데이터를 압축하는 인코더와 이를 복원하는 디코더의 구조로 구성된다. 데이터를 압축하여 작은 차원의 표현(Representation)을 얻기 위한 인공신경망 모델이다. 데이터를 압축하여 중요한 요소를 추출하는 인코더와 이를 다시 복원하여 원본을 얻는 디코더 구조로 구성된다. 인코더를 통해 데이터의 중요한 특징을 추출하는 용도로 주로 활용되는데, 오토인코더를 기반으로 발전한 모델인 변분 오토인코더(Variational Autoencoder, VAE)는 데이터와 유사한 새로운 데이터를 생성하는 생성 인공지능 모델에서도 활용된다. [오토인코더의 기본 구조] 오토인코더는 인코더(Encoder)와 디코더(Decoder)로 구성되는데, 두 모델은 동시에 학습된다. 인코더는 입력 데이터를 받아 행렬 연산을 통해 작은 차원으로 압축(인코딩)한다. 이 때 압축된 결과물을 잠재 벡터(Latent Vector)라고 한다. 디코더는 압축된 데이터를 입력으로...서포트 벡터 머신 [Support Vector Machine]기계 학습에서 초평면의 형태로 데이터 분포를 학습하는 알고리즘. 분류와 회귀 모두에서 사용 가능한 초평면(Hyperplane)을 찾는 기계 학습 알고리즘으로, 영문 머리글자를 따 ‘SVM’이라고도 불린다. 서포트 벡터 머신은 고차원 데이터에서도 좋은 성능을 보여 딥 러닝이 등장하기 전까지 대표적인 기계 학습 모델로 활용되었다. [분류와 회귀에서의 활용] 분류 문제에서 서포트 벡터 머신의 기본 목표는 두 클래스(Class)를 최대한으로 분리하는 경계를 찾는 것이다. 서포트 벡터란 경계에 가장 가까운 데이터를 의미하는데, 각 클래스에 대한 서포트 벡터 사이의 거리를 마진(Margin)이라고 한다. 서포트 벡터 머신은 마진을 극대화하는 경계선을 찾아 데이터 분류의 오차 범위를 최소화한다. 회귀 문제에서 서포트 벡터 머신은 모든 데이터에 대한 추세선을 찾아 추세선에서 벗어나는 범위를 최소화한다. 여기서는 추세선에서 가장 벗어나는 데이터와의 거리가 마진이 된다. 아래의...K-최근접 이웃법 [K-Nearest Neighbors]기계 학습에서 데이터의 유사성을 기반으로 분류와 회귀 작업에 사용하는 비학습 기반의 알고리즘. K-최근접 이웃법은 데이터의 유사성을 기반으로 새로운 데이터에 대해 분류와 회귀와 같은 의사 결정을 수행하는 기계 학습 알고리즘을 말한다. K는 의사 결정 과정에서 고려하는 유사한 이웃 데이터의 수를 나타내며, 데이터 간의 유사성은 데이터 간의 거리(Distance)를 계산하여 구한다. 예를 들어 K가 3인 경우 새로운 데이터와 가장 거리가 가까운 3개의 데이터 정보를 참고하여 결과를 도출하게 된다. K-최근접 이웃법은 초매개변수인 K값과 거리 결정 방법을 결정하는 것을 제외하고는 별도의 매개변수가 필요하지 않기 때문에 학습을 수행하지 않는다. [K-최근접 이웃법의 작동 메커니즘] 훈련 데이터가 주어지고, 새로운 데이터가 주어질 때, K-최근접 이웃법은 새로운 데이터와 모든 훈련 데이터 사이의 거리를 구하게 된다. 데이터 간의 거리는 일반적으로 n차원 공간에서 두...프롬프팅 [Prompting]거대 언어 모델에서 입력을 제공하여 출력을 생성시키는 과정. 프롬프팅은 거대 언어 모델(Large Language Model, LLM) 에서 모델이 응답을 수행하도록 하기 위한 프롬프트(Prompt)를 작성하여 입력하는 과정이다. 사용자가 작성한 프롬프트는 단어나 토큰 단위로 분리되고, 이는 임베딩(Embedding) 과정을 통해 모델이 이해할 수 있는 벡터 형태로 변환되어 모델에 입력된다. 프롬프팅은 모델의 출력 성능에 큰 영향을 미치기 때문에, 거대 언어 모델의 연구자들은 정확하고 유용한 출력을 생성하기 위해 좋은 프롬프트를 구성하는 방법에 대해 많은 연구를 진행되었고, 이를 프롬프트 엔지니어링(Prompt Engineering)이라고 한다. 거대 언어 모델은 기본적으로 생성 모델이기 때문에, 사용자의 입력에 대응하는 답변을 순차적으로 생성한다. 만약 ‘한국의 수도는 어디입니까?’라는 질문을 프롬프트로 받게 된다면, 해당 질문 다음에 들어가야 하는 단어들 중 확률이 높은...합성곱 신경망 [Convolutional Neural Network]컴퓨터 비전 분야에서 주로 사용되는 합성곱 기반의 인공 신경망 모델. 영문 머리글자를 따 ‘CNN’이라고도 부른다. 이미지와 같은 형태의 데이터를 처리하는 데에 적합한 구조를 가진 합성곱(Convolution) 기반의 인공 신경망 모델을 말한다. 인간의 시각 피질의 구조를 모방하여 데이터로부터 주요 특징을 추출하며, 데이터의 차원에 따라 1차원 합성곱 신경망, 2차원 합성곱 신경망, 3차원 합성곱 신경망 등으로 표현한다. 합성곱 신경망의 가장 큰 특징은 데이터의 공간적 특성을 보존하며 인공 신경망에 전달할 수 있다는 것이다. 만약 합성곱 신경망이 아닌 단순 다중 퍼셉트론 형식의 인공 신경망에 10*10 크기의 2차원 데이터를 입력으로 넣는다면, 2차원 데이터는 100의 길이를 가진 1차원의 입력으로 변환되어 공간적 특성을 보존할 수 없다. [합성곱 신경망의 구조] 합성곱 신경망은 합성곱 계층(Convolution Layer), 풀링 계층(Pooling Layer), 완전 연결...너비 우선 탐색 [Breadth-First Search]그래프를 탐색할 때, 인접한 노드부터 차례대로 탐색하는 알고리즘. 너비 우선 탐색은 그래프를 탐색하는 알고리즘으로, 영문 머릿글자를 따 BFS라고도 부른다. 시작점을 기준으로 동일한 깊이의 경로를 차례대로 탐색하는 방식이다. 그래프 구조에서 분기점이 나타나게 되면 모든 점을 순서대로 탐색한 뒤, 탐색한 순서대로 각 점의 남은 인접 노드를 탐색한다. [너비 우선 탐색과 큐] 너비 우선 탐색의 알고리즘은 큐(Queue)의 선입선출(先入先出, FIFOFirst in First out) 구조를 사용한다. 큐(Queue)란 먼저 들어간 데이터가 가장 먼저 나오도록 저장하는 자료구조의 한 형식을 뜻한다. 현재 방문 중인 노드에서 순서대로 인접 노드를 큐에 추가하여 미래의 방문 목록을 갱신한다. 그 다음, 큐에 저장된 다음 노드를 방문하여 같은 방식으로 큐를 갱신한다. 아래의 그래프를 탐색하는 것을 예로 들어 보면, A번 노드에서 시작할 때 B와 C를 미래의 방문 목록에 넣는다. B를 방문한 뒤...생성 인공지능 [Generative Artifical Intelligence]딥 러닝 기술을 이용하여 새로운 데이터를 생성하는 인공지능 기술. 생성 인공지능은 학습한 데이터를 이용하여 새로운 데이터를 생성하는 기술들을 일컫는 말이다. 여기에는 텍스트, 이미지, 오디오, 소스 코드 등의 다양한 형태가 포함된다. 최근에는, 서비스 분야에서 사용자의 입력에 따라 콘텐츠를 생성하는 모든 종류의 인공지능을 생성 인공지능으로 통칭하고 있다. 생성 인공지능은 OpenAI의 챗GPT(ChatGPT)가 공개된 이후 전세계적인 관심을 끌게 되었다. 챗GPT는 자연어 데이터에 대한 높은 수준의 이해를 바탕으로 답변을 생성하며 질의응답만이 아닌 창작, 요약, 번역 등 모든 분야에서 높은 성능을 보이고 있다. 최근에는 챗GPT뿐만 아니라 다양한 모델에서 생성 인공지능을 이용해 생성된 콘텐츠가 급격히 증가하며 생성 인공지능은 21세기의 핵심 기술로 자리잡았다. 생성 인공지능은 아래와 같은 분야에서 사용되고 있다. [생성 인공지능의 활용 예] - 챗GPT를 비롯한 거대...패스트텍스트 [FastText]단어를 더 작은 단위로 분할하여 학습하는 딥 러닝 기반의 임베딩 방법. 2017년 페이스북(현 메타)에서 개발한 오픈 소스 알고리즘으로, 단어를 서브워드(Subword) 단위로 분할하여 학습하는 임베딩 방법이다. 기존의 단어 임베딩 방법인 워드투벡(Word2Vec)의 한계를 극복하고, 그 범용성을 향상시켰다. 패스트텍스트 이전에 가장 많이 활용되던 임베딩 방법은 단어 임베딩 방법인 워드투벡이었다. 워드투벡은 단어들간의 의미론적 관계를 잘 포착하는 직관적인 방법이었으나, 임베딩이 단어 단위로 이루어져 사전에 학습되지 않은 단어가 등장하거나 철자가 틀린 경우 제대로 학습하지 못하는 문제가 있었다. 일반적으로 해당 문제를 OOV(Out-Of-Vocabulary) 문제라고 부른다. 패스트텍스트는 이 문제를 해결하기 위해 단어를 N-gram 단위의 서브워드로 분할한 결과를 추가한다. 이 때, 맨 앞과 맨 뒤에 해당하는 경우 시작과 종료 토큰을 추가하여 분할한다. 예를 들어...JSON [JavaScript Object Notation]전송하고자 하는 데이터를 '속성(Attribute)'과 '값(Value)'으로 나열해서 표현하는 형식. 데이터 전송 및 교환을 위한 표준화된 텍스트 형식 중 하나이다. '속성'과 '값'혹은 '키(Key)'와 '값(Value)'의 형태로 구분해서 표현하며, 주로 웹 브라우저와 웹 서버 간의 데이터 교환 등에 사용된다. 확장형 마크업 언어인 XML(eXtensible Markup Language)에 비해 가볍고 용량을 적게 차지한다는 장점이 있다. 시작과 종료를 구분하는 태그가 없으며, 웹 사이트 개발에 주로 사용하는 스크립트 언어인 자바스크립트(JavaScript)의 기본적인 구문 형식을 따른다. [JSON 특징] 자바스크립트 구문을 기반으로 하기 때문에 웹 브라우저에서 쉽게 해석할 수 있다. 또한 형식이 단순하여 자바(JAVA)나 C#과 같은 대부분의 프로그래밍 언어에서도 쉽게 사용할 수 있다. 일정한 규칙이 있어 config 등의 환경 설정 파일에서 사용할 수 있지만, 프로그래밍 코드에 대한 설명인 주석은...벡터 데이터베이스 [Vector Database]벡터 데이터를 효과적으로 처리하는 데이터베이스 시스템. 벡터 데이터베이스는 벡터 형태의 데이터를 저장하고 색인하는 작업에 특화된 데이터베이스 시스템이다. 기존의 데이터베이스는 문자열이나 테이블과 같은 정형화된 데이터를 저장하는 기능을 담당했다면, 벡터 데이터베이스는 고차원 벡터를 저장하고 관리하는 역할을 한다. [벡터 데이터베이스와 인공지능] 벡터 데이터베이스는 비정형 데이터를 처리하는 딥 러닝 기술이 발달하면서 그 중요성이 더욱 증가하였다. 텍스트나 이미지, 음성과 같은 비정형 데이터는 딥 러닝의 입력으로 전달되기 위해 주로 임베딩(Embedding) 과정을 통해 고차원 벡터로 변환되는데, 이 때 벡터 데이터베이스를 이용하면 대용량의 데이터를 더 빠르고 효율적으로 처리할 수 있다. 추천 시스템이나 이미지 색인, 자연어 처리와 같은 분야에서 임베딩으로 변환된 데이터들은 주로 다른 데이터 임베딩들과의 유사성 검색을 수행하게 된다. 예를 들어, 추천...전이 학습 [Transfer Learning]딥 러닝에서, 사전에 학습시킨 모델을 활용하여 새로운 문제에 효과적으로 적응하는 방법. 전이 학습은 한 영역에서 얻은 지식을 다른 영역의 문제에 적용하는 딥 러닝의 학습 기법이다. 기존에 학습된 모델을 새로운 문제에 적용하여, 문제를 단독으로 해결하는 것에 비해 높은 성능을 내거나 훈련 시간을 절약할 수 있다. 또한 새로운 문제에 활용할 데이터가 적은 경우에도 높은 성능을 발휘할 수 있다. 전이 학습의 전제는 사전에 학습된 모델의 기능이 새로운 문제에서도 효과적으로 활용될 수 있어야 한다는 것이다. 데이터의 관점에서 볼 때, 두 문제에서 사용하는 데이터가 동일하거나, 어느 정도 비슷한 분포나 특징을 갖는 데이터인 경우가 해당한다. 모델의 관점에서는 해당 모델이 데이터의 특징을 잘 추출할 수 있고, 그 특성이 새로운 문제에서도 유지되어야 한다. [전이 학습의 방법] 전이 학습은 크게 미세 조정(Fine Tuning)과 특징 추출(Feature Extraction)로 나눌 수 있다....인공지능 윤리 [AI Ethics]인공지능 기술을 개발하고 적용하는 것에 대한 윤리적 원칙과 고려사항. 인공지능 기술은 급속한 발전을 거듭하며 인류의 다양한 분야에 중대한 영향을 주고 있다. 인공지능 윤리는 인공지능 기술의 사회적 영향을 고려하여, 사회의 공공선을 지키고 인류의 삶에 기여하는 방향으로 인공지능의 발전을 안내하기 위한 규약이다. [인공지능 윤리의 기본 원칙] 인공지능 윤리는 아래와 같은 주요 원칙을 중점적으로 고려한다. ① 공정성: 기계 학습을 기반으로 하는 인공지능 시스템은 데이터에 존재하는 패턴을 학습하는 데이터 마이닝의 과정을 거치게 되는데, 이 과정에서 편향성이 발생할 수 있다. 편향된 인공지능은 실제 환경에서 차별과 같은 불공정한 결과를 초래할 수 있으므로, 학습 데이터의 설정과 모델 설계 등의 모든 과정에서 이를 해결하기 위한 노력을 기울여야 한다. 예를 들어, 거대 언어 모델의 경우 윤리적 활용을 위해 적절하지 않은 응답이나 편견이 포함된 응답을...디지털 헬스케어 [Digital Healthcare]디지털 기술을 헬스케어 분야에 적용하여 의료의 효율성과 정확성, 접근성을 향상시키는 분야. 디지털 헬스케어는 디지털 기술을 헬스케어 분야에 결합하여 의료를 개선시키는 기술이다. 이는 환자의 삶의 질을 향상시키고, 의료 서비스의 범위를 확장하는 데 중요한 역할을 한다. 디지털 헬스케어는 의료 서비스의 제공부터 환자 관리, 의료 데이터 분석에 이르기까지 의료의 전 과정에서 효율성과 접근성을 향상시키는 방향으로 발전하고 있다. 이를 통해 환자 중심의 맞춤형 의료 서비스 제공이 가능해지며, 의료진의 의사 결정 지원에도 크게 기여하고 있다. [병원에서의 디지털 헬스케어] 병원에서의 디지털 헬스케어는 전자 건강 기록(EHR)을 디지털화하여 공유할 수 있는 기능을 제공한다. 이를 통해 환자의 전체 의료 이력을 쉽게 관리하고, 필요한 정보를 신속하게 제공할 수 있다. 또한 원격 의료 상담 서비스를 통해 환자가 병원에 직접 방문하지 않고도 의사와 상담할 수 있다. 생성...초인공지능 [Artificial Super Intelligence]모든 영역에서 인간의 한계를 넘어선 단계의 인공지능. 초인공지능은 좁은 인공지능(Artificial Narrow Intelligence), 범인공지능(Artificial General Intelligence)을 넘어선 다음의 인공지능 단계를 의미한다. 초인공지능은 창의성과 지적 능력을 비롯한 모든 분야에서 인간의 지능을 크게 능가하며, 스스로 자기 개선이 가능한 단계이다. [초인공지능이 사회에 미칠 영향] 많은 과학자들에 따르면, 초인공지능은 인간의 사고 범위를 넘어선 속도의 발전과 의사 결정이 가능할 것으로 보인다. 또한 자기 개선이 가능하므로 연쇄적인 자기 발전을 통해 어느 순간 인간의 이해의 범위를 초월하는 ‘지능 폭발’이 일어날 것으로 예측된다. 초인공지능은 인간이 풀지 못했던 기후 위기와 같은 난제에 대한 정확한 해답을 제시할 수도 있지만, 이러한 해답이 인간에게 항상 긍정적으로만 작용할 것인가에 대해서는 불확실하다. 여지가 있다. 인공지능의 대표적인 석학인...워드투벡 [Word2Vec]지역적 문맥을 고려하여 딥 러닝으로 단어를 벡터화하는 대표적 자연어 임베딩 방법. 워드투벡은 딥 러닝 기반의 단어 임베딩 방법으로, 단어들 사이의 의미론적 관계를 벡터 공간에 표현한다. 그리고 단어의 지역적인 문맥을 고려하여 단어들 간의 관계를 학습한다. 예를 들어, ‘고양이가 물을 마신다’ 라는 문장이 주어지면 ‘고양이가’ 와 ‘마신다’가 주어졌을 때 ‘물을’ 단어가 사이에 등장한다는 규칙을 학습하는 것이다. 워드투벡은 비슷한 의미의 단어에 비슷한 벡터를 부여하게 되는데, 이를 통해 아래와 같은 예시가 가능하다. 이를 학습하기 위해서는 해당 데이터가 충분히 주어져야 한다. ① 형용사 관계 학습: ‘런던’ 과 ‘영국’의 벡터 차이는 ‘서울’과 ‘한국’의 벡터 차이와 유사하다. 따라서 ‘런던’-’영국’+’한국’ =‘서울’ 와 유사한 결과가 나온다. ② 동사의 과거형 학습: ‘가다’ 와 ‘갔다’의 차이는 ‘먹다’와 ‘먹었다’ 의 벡터 차이와 유사하다....심즈 [The Sims]맥시스(Maxis)에서 제작한 최초의 생활 시뮬레이션 게임 시리즈로, 2000년 2월 4일에 출시하였다. 미국의 게임 회사인 일렉트로닉 아츠(Electronic Arts, EA) 산하의 게임 스튜디오인 맥시스에서 개발하고, 일렉트로닉 아츠에서 유통하는 PC 게임으로, 최초의 생활 시뮬레이션 게임 시리즈이다. 〈심시티(SimCity)〉(1989)의 개발자이기도 한 미국의 게임 디자이너 윌 라이트(William Ralph Wright)가 개발하였다. 2000년 2월 4일에 마이크로소프트 윈도우로 출시하여 큰 인기를 얻으며 플레이스테이션, 엑스박스 등 콘솔 버전으로도 출시되었고, 이후 시리즈로 제작되었다. 각 시리즈마다 다양한 형태의 확장팩과 아이템 팩 등을 출시하는 것이 특징적이다. [시리즈] 2000년에 출시된 〈심즈〉는 PC게임으로 큰 인기를 얻으며 총 7개의 확장팩이 발매되었다. 2004년 9월 17일에는 〈심즈2〉가 발매되었는데, 2D 쿼터뷰 시점에 3D 캐릭터를 접목하여 만든 전작과 달리 풀...프롬프트 엔지니어링 [Prompt Engineering]거대 언어 모델의 효과적인 응답을 도출하기 위해 프롬프트를 개선하는 방법. 프롬프트 엔지니어링은 거대 언어 모델(Large Language Model, LLM)의 입력에 해당하는 프롬프트(Prompt)를 효과적으로 만들고 최적화하는 과정을 뜻한다. 거대 언어 모델이 자연어 처리뿐만 아니라 다양한 분야에 있어서 매우 중요한 역할을 차지하면서, 적절한 프롬프트 구성에 대한 관심이 크게 증가하였다. 거대 언어 모델은 자연어의 의미를 이해하고 이에 대응하는 응답을 생성하지만, 그 방식은 사람의 방식과 다르게 구성되어 있다. 이 때문에 모델의 특수한 구조를 고려하여 적절한 프롬프트를 만들어야 한다. 이는 새로운 데이터를 학습시켜 모델의 매개변수를 수정하는 파인튜닝(Fine-tuning)과는 달리, 모델에 입력되는 프롬프트만을 수정하는 데에 초점을 맞춘다. [대표적인 프롬프트 엔지니어링] 일반적으로 프롬프트에는 답변을 얻고자 하는 질문을 포함하지만, 아래의 방법을 활용하면 보다...앙상블 학습 [Ensemble Learning]기계 학습의 성능을 높이기 위해 여러 개의 모델을 조합하여 의사 결정에 활용하는 방법. 다수의 모델의 결과를 결합하여 예측의 성능과 견고함을 향상시키는 기계 학습 기법을 말한다. 분류 문제의 경우 결과를 종합하여 우세한 레이블을 선택하거나, 회귀 문제의 경우 결과의 평균을 취하여 이를 앙상블 모델의 결과로 채택한다. 앙상블 모델을 활용하면 단일 모델에 비해 편향이 적은 결과를 얻을 수 있다. 기계 학습 모델들은 알고리즘에 따라 데이터의 특징과 패턴을 학습하는 방식이 각기 다르며, 같은 모델이라도 샘플링에 따라 다른 결과를 나타내기도 한다. 앙상블 학습은 여러 개의 모델을 학습시켜 그 결과를 조합하면 보다 높은 성능을 얻을 수 있다는 원리에 기반한다. 만약 모터의 불량 여부를 판별하는 정확도가 90%인 모델 3개를 활용하여 다수결의 원칙으로 답을 내리는 앙상블 학습을 한다고 가정하자. 정확도가 ‘불량품을 불량으로 판별할 확률’이라고 한다면, 각 모델이...TF-IDF [Term Frequency-Inverse Document Frequency]텍스트 마이닝에서 특정 문서에서 단어의 중요도를 계산하는 방법. 텍스트 마이닝(Text Mining)에서 문서를 분석하는 기법 중 하나로, 문서에서 특정 단어의 중요도를 계산하는 방법이다. 단어의 빈도(Term Frequency, TF)와 문서 빈도의 역(Inverse Document Frequency, IDF)을 곱하여 계산한다. [TF-IDF의 계산법] TF(단어의 빈도)는 각 문서를 단어의 집합으로 변환한 뒤, 전체 토큰의 수에서 해당 단어의 비율을 구하여 계산한다. 예를 들어, [하늘 푸른 하늘] 이라는 문서가 있을 때 해당 문서에서 ‘하늘’ 단어의 TF는 2/3이 된다. 이를 통해 해당 문서에서 단어의 중요성을 표현한다. IDF(역문서 빈도)는 전체 문서에서 해당 단어의 중요성을 구하는 방법으로, 전체 문서의 수를 단어가 포함된 문서의 수로 나눈 뒤 로그값을 취한다. 예를 들어, 총 10개의 문서 중 2개의 문서가 ‘하늘’ 이라는 단어를 포함하고 있다면 ‘하늘’의 IDF 값은 log(5)가 된다. 문서에 대한...범인공지능 [Artificial General Intelligence, AGI]모든 영역에서 스스로 판단하고 사고하는 인공지능의 진화 단계로, 범용 인공지능, 인공 일반 지능이라고도 불린다. 범인공지능은 약한 인공지능(Weak Articial Intelligence)이 진화된 형태를 의미한다. 약한 인공지능이란, 알파고(AlphaGo, 바둑), 딥블루(Deep Blue, 체스)와 같이 한 분야에 특화되어 인간 이상의 성능을 보이는 인공지능이 해당된다. 특정 분야에만 뛰어난 성능을 보이는 약한 인공지능의 한계를 극복한 형태의 인공지능을 범인공지능이라고 부른다. 범인공지능의 정의에 대해서는 다양한 형태의 설명이 존재하나, 공통된 점은 한 분야에만 특화된 약한 인공지능에 비해 모든 분야에서 학습하고 수행할 수 있는 인공지능이라는 것이다. 이는 데이터를 통해 학습시켜야만 하는 약한 인공지능에 비해 범인공지능이 갖는 특징이다. 만약 모든 영역에서 스스로 판단하는 범인공지능이 등장한다면, 학자들은 범인공지능이 인류의 지능 영역을 능가하고, 넘어설...알고리즘 편향성 [Algorithm Bias]알고리즘이 의사 결정 과정에서 편향된 결과를 도출하는 현상. 주로 인공지능 시스템에서 알고리즘이 편향된 결과를 도출하는 현상을 말한다. 이는 데이터의 분포, 알고리즘의 설계, 알고리즘 사용자의 판단 등 다양한 요인에 기인한다. [알고리즘의 편향성과 공정성] 여러 이유로 인해 알고리즘의 결과가 ‘공정성’을 깨는 현상이 발생할 때, 이를 알고리즘의 편향성이라고 부른다. 여기서 공정성이란, 그 적용의 대상이 되는 사용자들에게 동등한 기회를 제공하며, 특정 그룹을 불공정하게 차별하거나 우대하지 않는 것을 의미한다. 편향성에 대한 오해 중 하나는 편향성을 마치 알고리즘의 오작동과 같은 개념으로 생각하는 것이다. 편향성은 알고리즘의 오류가 아닌 알고리즘의 학습 결과이며, 그 결과가 의도하지 않게 사회적으로 공정하거나 윤리적인 결과로 이어지지 않은 경우에 나타나는 현상으로 볼 수 있다. [알고리즘 편향성의 원인] 알고리즘 편향성은 인간의 의사 결정 과정에서...언덕 등반 탐색 [Hill-Climbing Search]현재의 위치에서 최적의 상태로만 이동하여 지역 최적해를 찾는 최적화 탐색 기법. 알고리즘과 기계학습 분야에서 사용되는 탐색 기법으로, 휴리스틱 탐색 방법 중 하나이다. 문제 공간에서 정의되는 ‘지역 최적해(Local Optima)(함수 내에서 원하는 구간에서의 극값)’를 찾는 데에 적합하다. 언덕 등반 탐색은 최대화 문제의 경우 해당 함수값이 커지는 방향으로, 최소화 문제의 경우 해당 함수값이 작아지는 방향으로 계속 탐색을 수행한다. 최대화 문제를 푸는 과정이 언덕을 등반하는 것과 유사하기 때문에 이와 같은 이름으로 불린다. 언덕 등반 탐색을 수행하기 위해서는 각각의 정답 후보를 평가하는 함수인 평가 함수(Evaluation Function) 혹은 휴리스틱 함수(Heuristic Function)가 정의되어야 한다. 예를 들어, 기계 학습 문제의 오차를 최소화하는 문제에서 기계 학습 모델의 가중치가 정답 후보로 주어진다면, 해당 가중치를 사용했을 때의 오차값이 평가 함수가 된다....전문가 시스템 [Expert Systems]전문 지식을 활용하여 전문가의 역할을 대신하는 인공지능의 종류. 전문가 시스템은 인공지능의 한 종류로, 특정 영역의 전문 지식을 저장하고 이를 활용하여 사용자의 의사 결정을 돕는 컴퓨터 시스템이다. 전문가 시스템은 크게 지식 베이스, 추론 기관, 사용자 인터페이스의 세 가지 구성 요소로 나누어진다. 지식 베이스에서는 특정 분야의 전문 지식을 컴퓨터가 이해할 수 있는 형태로 변환하여 저장하며, 추론 기관은 이를 이용하여 문제를 해결하기 위한 논리를 구성한다. 마지막으로 사용자 인터페이스를 통해 전문가 시스템의 사용자와 상호작용을 수행한다. [전문가 시스템의 발전 과정] 초창기의 전문가 시스템은 인간 전문가의 능력을 모사하기 위해 지식을 컴퓨터에 저장하고, 이를 바탕으로 추론을 수행하여 의사 결정에 필요한 정보를 전달하는 것을 목적으로 하였다. 스탠포드의 ‘파이겐바움(Feigenbaum)’은 유기 화합물에 질량 분석을 수행한 결과를 입력하면 화합물의...지능형 에이전트 [Intelligent Agent]자율적이고 지능적으로 행동하여, 사용자를 대신해서 작업을 수행하는 소프트웨어의 형태. 컴퓨팅 환경에서 사용자를 대신하여 작업을 수행하는 소프트웨어를 일컫는다. 자율적이고 지능적으로 행동한다는 점에서 일반적인 프로그램과 구분되는 개념이다. 지능형 에이전트의 개념은 1990년대에 처음 제안되었다. 인터넷이 발달함에 따라 웹 상에서 많은 정보를 탐색하고 복잡한 작업을 수행하여야 하는 경우가 증가하여 에이전트의 필요성이 증가하게 되었다. 지능형 에이전트는 인공지능과 유사하지만, 현대의 인공지능에 비해 상대적으로 추상적인 개념에 속하며, 인공지능의 핵심인 학습(러닝, Learning)보다는 특정한 기능의 수행에 초점을 맞춘 개념으로 볼 수 있다. 간단한 이메일의 자동 전달 시스템부터, 복잡한 인공지능 시스템까지 모두 지능형 에이전트의 형태에 속한다. 데이터 마이닝 기술을 활용하여 사용자의 과거 음악 감상 내역을 바탕으로 좋아할 만한 아티스트의 곡을 추천해...강화 학습 [Reinforcement Learning]에이전트의 행동에 따른 보상을 통해 전략을 학습하는 기계 학습의 한 종류. 강화 학습은 인공지능 모델의 행동을 학습하는 방식으로, 행동에 따른 주변 환경과의 상호작용에서 오는 보상을 최대화하는 방법을 통해 최적의 전략을 찾는 방법이다. 정답 데이터인 레이블을 통해 학습하는 지도 학습과 다르게, 강화 학습은 행동에 따른 결과를 보상의 형태로 얻으며, 특정 시점에서 누적된 보상의 합을 최대화하는 방향으로 학습한다. 따라서 강화 학습은 명확한 정답이 정해져 있지 않은 문제에 효과적으로 적용될 수 있으며, 실제로 컴퓨터 게임과 바둑과 같은 게임의 인공지능 분야에서 큰 성공을 거두며 주목을 받았다. 가장 대표적으로 알려진 모델은 구글 딥마인드의 알파고(AlphaGo)로, 2016년 한국의 프로 기사 이세돌과의 대국이 큰 화제가 되었다. [강화 학습의 구성 요소] 강화 학습 문제는 다음과 같은 구성 요소를 갖는다. ①에이전트(Agent): 학습을 실제로 수행하는 개체로...블레츨리 선언 [Bletchley declaration]2023년 제1회 AI 안전 정상회의에서 발표한 선언으로, AI 기술 안전에 관한 내용이 담겨있다. 2023년 11월 1일 영국 버킹엄셔(Buckinghamshire)에 위치한 블레츨리 파크(Bletchley Park)에서 '제1차 AI 안전성 정상회의(AI Safety summit)'가 열렸다. 영국, 미국, 중국, 한국 등 세계 주요 28개국과 유럽연합(EU)이 참석했으며, 이 날 인공지능(AI) 기술 안전에 관한 내용이 담긴 '블레츨리 선언(Bletchley declaration)'이 채택되었다. 블레츨리 선언문에서는 '고도의 능력을 갖춘 프런티어 AI로 인해 고의적이든 그렇지 않든 잠재적으로 파국적인 피해가 초래될 가능성이 있음'을 우려하며, 'AI로 인해 발생하는 많은 위험은 본질적으로 국제적이므로 국가간 협력을 해야 한다. 인간 중심적이고 신뢰할 수 있으며 책임감 있는 AI를 보장하기 위해 포괄적인 방식으로 협력하자'는 취지의 내용이 담겼다. 개최국인 영국의 리시 수낵(Rishi Sunak) 총리를 비롯하여 EU...팩맨 [Pac-Man]남코에서 제작한 대표적인 아케이드 게임 시리즈로, 1980년 7월에 최초로 출시되었다. 남코에서 제작한 대표적인 아케이드 게임이다. 입이 달린 노란 원 모양의 캐릭터 ‘팩맨’을 조종하여 적인 유령을 피해 미로에 떨어진 쿠키들을 모두 먹는 것을 목표로 하는 게임으로, 첫 시리즈는 1980년 5월 22일 첫 번째 포커스 테스트가 진행되었으며, 같은 해 7월 일본 전역에 출시되었다. 10월에는 미국에서 발매되어 북미 전역에서 큰 인기를 얻게 되었다. 〈팩맨〉은 당시 남성 게이머가 주를 이루던 아케이드 게임 시장에서 여성 게이머를 포섭하기 위해 기획된 게임으로 귀여운 캐릭터와 더불어 최소화된 폭력성이 특징적이다. 주인공 캐릭터인 ‘팩맨’은 개발자 이와타니 토루(岩谷 徹, Toru Iwatani)가 남은 피자 모양을 본 떠 만들었다. 〈팩맨〉은 미국 진출 이후 단숨에 1980년대 북미 문화의 아이콘으로 떠올라, 미국 ABC 방송국의 애니메이션으로 방영되기도 하였고 팩맨을 테마로 한...포켓몬스터 [Pokémon]게임 프리크에서 개발한 롤플레잉 게임 시리즈로, 1996년 2월 27일에 첫 번째 작품이 출시되었다. 게임 프리크(Game Freak)에서 개발하고 닌텐도에서 유통하는 RPG 게임 시리즈이다. 일본과 한국에서의 정식 명칭은 ‘포켓몬스터(ポケットモンスター)’이며, 국내에서는 약칭으로 ‘포켓몬’이라 칭하고, 일본에서는 발음상 '포케몬(ポケモン)'이라 줄여 말한다. 영어권에서의 정식 명칭은 ‘포케몬(Pokémon)’이다. 게임 프리크의 사장이자 게임 개발자인 다지리 사토시(田尻智)가 창작한 가상의 생물 ‘포켓몬’을 중심으로, 트레이너들이 포켓몬을 육성하여 배틀을 벌이는 세상을 배경으로 한다. 1996년 2월 27일에 첫 번째 작품인 〈포켓몬스터 레드‧그린((Pokémon Red‧Green)〉이 닌텐도의 휴대용 게임기인 게임보이로 출시된 이후, 코믹스와 애니메이션을 선보이며 게임 시리즈로는 물론 세계적으로 성공을 거둔 멀티미디어 프렌차이즈로 성장하였다. [시리즈]...컬러 TV 게임 [Color TV Game]일본의 닌텐도가 개발한 차세대 콘솔게임기이다. 일본 게임회사인 닌텐도에서 개발한 비디오 게임기이다. 1889년 화투 제조업체로 시작한 닌텐도는 1970년대 후반 비디오게임 산업에 진출하였는데, 1977년에 ‘컬러 TV 게임’을 출시하며 본격적으로 가정용 콘솔게임기를 제조하였다. ‘컬러 TV 게임(Color TV-Game)’은 미쓰비시와 공동으로 개발한 게임기로, 본체에 게임이 내장되어 있으며, 본체에 달린 컨트롤러를 사용하여 게임을 플레이한다. 게임 모델로는 6종류의 게임이 내장된 ‘컬러 TV 게임 6’(1977), 15종류의 게임이 내장된 ‘컬러 TV 게임 15’(1977), 122개의 게임이 내장되어 있고, 레이싱 휠과 변속 레버가 달린 ‘컬러 TV 레이싱 112(Color TV-Racing 112)’(1978)가 있다.젤다의 전설 [The Legend of Zelda]닌텐도에서 제작한 대표적인 액션 어드벤처 게임 시리즈로, 1986년 2월 21일에 첫번째 작품이 출시되었다. 닌텐도에서 제작한 대표적인 액션 어드벤처 게임 시리즈이자 콘솔 게임 시리즈이다. 판타지 세계인 하이랄 왕국을 무대로 하며 뛰어난 스토리와 게임성을 갖추었다. 첫 번째 작품인 〈젤다의 전설(The Legend of Zelda)〉은 1986년 2월 21일, 닌텐도의 패밀리 컴퓨터 확장 기기인 패미컴 디스크 시스템과 함께 발매되어 큰 인기를 얻으면서 시리즈로 제작되었다. 〈슈퍼마리오 브라더스(Super Mario Bros)〉(1985)의 개발자인 미야모토 시게루(宮本茂, Shigeru Miyamoto)가 구상한 게임으로, 액션 어드벤처 장르의 대명사로 쓰인다. 흥미로운 스토리와 퍼즐, 방대한 모험 등이 결합한 게임이며 레벨 디자인 밸런스가 뛰어난 작품으로 평가받는다. [시리즈] 1986년 첫 번째 작품인 〈젤다의 전설〉의 성공 이후, 1987년 1월 14일에는 〈젤다의...심층 신경망 [Deep Neural Network]다층의 인공신경망 뉴런 구조로 복잡한 패턴을 인식하고 학습하는 인공지능 기술. 심층 신경망은 여러 층으로 구성된 인공 신경망 구조를 통틀어서 일컫는 용어로, 딥 러닝의 가장 대표적인 기법이다. 각각의 층은 인공 신경망의 노드(뉴런)들로 구성되는데, 이전 층의 출력을 입력으로 받아 처리하고, 그 결과를 다음 층으로 전달한다. 이러한 구조를 통해 데이터의 복잡한 패턴을 추출하고 인식할 수 있다. 노드들은 가중치와 활성화 함수를 통해 입력 데이터를 처리하며, 학습 메커니즘을 통해 가중치를 개선하게 된다. 심층 신경망에서 입력층(Input Layer)과 출력층(Output Layer) 사이에 존재하는 노드들을 은닉층(Hidden Layer)이라고 부른다. 은닉층은 심층 신경망의 중간 결과를 계산하고 이를 다음 층으로 전달하는 역할을 한다. [심층 신경망의 역사] 1957년 로젠블랏(Rosenblatt)은 단층 퍼셉트론(Perceptron)의 개념을 도입하였으나, XOR 문제와 같은 비선형 문제를...인공 신경망 [Artificial Neural Network, ANN]동물의 뇌 뉴런의 작동 원리를 모방하여 만든 기계 학습 알고리즘의 한 종류. 동물계에서 뇌의 뉴런이 작동하는 방식을 모방하여 만든 머신 러닝 알고리즘을 말한다. 딥 러닝의 심층 신경망(DNN)이 대표적인 인공 신경망 기반의 인공지능이다. 두 개념은 종종 혼용되어 쓰이고 있으나, 인공 신경망이 심층 신경망보다 더 넓은 개념을 포함하고 있다. [뉴런과 인공 신경망] 인공 신경망은 뉴런의 신호 전달 방식을 모방하여 입력-처리-출력의 과정을 수행한다. 뉴런의 ‘수상 돌기(Dendrites)’를 통해 입력 신호가 전달되고, 그 세기가 임계값(Threshold) 이상인 경우 ‘축삭 돌기(Axon)’을 통해 이어진 다른 뉴런의 수상 돌기로 전달된다. 인공 신경망은 이 부분을 모방하여, 입력을 받아 계산하고 계산한 결과를 조건에 따라 출력하는 구조를 띠게 되었다. [인공 신경망의 발전] 인공 신경망이라는 용어가 처음 제안되었을 당시의 개념은 현재의 딥 러닝에서 사용하는 인공...순환 신경망 [Recurrent Neural Network]시퀀스 데이터를 처리하는 것에 특화된 인공 신경망 모델. 시퀀스(Sequence) 데이터 처리에 특화된 인공 신경망 모델을 말한다. 시퀀스 데이터란 음성이나 텍스트, 또는 시간에 따라 측정되는 값을 말하는데, 데이터가 순차적으로 생성되며 데이터들 간의 순서나 관계가 중요하다는 특징을 갖는다. 이를 효과적으로 고려하기 위해, 순환 신경망은 이전 시점의 정보를 내부에 저장하는 일종의 ‘기억 장치’를 갖는다. 또한 데이터의 길이에 구애받지 않고 무한히 순차적으로 입력을 수행할 수 있는데, 이에 따라 ‘순환 신경망’이라는 이름이 붙었다. [순환 신경망의 작동 원리] 순환 신경망 모델에 특정 시점의 데이터가 입력되면, 모델은 이를 받아 스스로의 기억 장치를 업데이트하고 그 이후 다음 시점의 데이터를 입력받게 된다. 다음 시점의 데이터를 입력받을 때의 기억 장치는 처음부터 직전 시점까지의 데이터를 모두 입력받은 상태의 잠재적 정보를 저장하며, 이를 은닉 상태(Hidden...얼굴 인식 [Face Recognition]이미지에서 사람의 얼굴을 추출하고, 이를 통해 신원을 확인하는 생체 인식 기술 중 하나. 생체 인식 기술 중 얼굴에 대한 정보를 활용하여 신원을 확인하는 기술을 말한다. 얼굴 인식 기술은 그 목적에 따라 1:1 얼굴 인식과 1:N 얼굴 매칭으로 나눠진다. 1:1 얼굴 인식은 얼굴 확인(Face Verification)이라고도 불리며, 주로 데이터베이스에 저장된 한 명의 얼굴과 주어진 얼굴이 얼마나 일치하는지를 통해 동일인의 여부를 판단한다. 아이폰의 ‘Face ID’와 같은 기술이 이에 해당한다. 1:N 얼굴 매칭의 경우 데이터베이스에 여러 명의 얼굴이 저장되어 있으며, 이 중에 주어진 얼굴이 어떤 사람인지를 찾는 분류(Classification) 문제로 볼 수 있다. 몇몇 국가에서 시행하는 공공장소의 얼굴 인식 시스템 등이 이에 해당한다. 얼굴 인식 기술은 기존의 인증과 신원 확인에 걸리는 시간과 비용을 단축할 수 있어 잠재적인 가치가 매우 큰 기술로 평가된다. 딥 러닝의 발달 이후에는 딥...좁은 인공지능 [Artificial Narrow Intelligence,]특정 작업에 특화된 인공지능을 뜻하며, 범용 인공지능이나 초인공지능과 대비된다. 인공지능 가운데 특정한 작업이나 문제를 해결하는 방향으로 특화된 인공지능을 의미한다. 현재의 인공지능은 그 적용 방향에 따라 좁은 인공지능, 범용 인공지능, 그리고 초인공지능으로 분류되는데, 좁은 인공지능은 가장 기본적이고 제한된 형태에 속한다. 좁은 인공지능은 특정 분야에서 인간의 능력을 능가하거나 초과할 수 있는 능력을 가지고 있지만, 그 외의 문제에서는 활용이 불가능한 경우가 많다. 이는 좁은 인공지능이 해당 분야에 관련된 데이터만으로 학습되었기 때문이다. 대부분의 전통적 머신 러닝이나 딥 러닝을 활용한 모델들은 좁은 인공지능에 속한다. [범용 인공지능으로의 발전 가능성] 좁은 인공지능의 단계에서 범용 인공지능으로 나아가기 위해서는 인공지능의 학습 범위를 여러 분야에 대한 인간 수준의 이해가 가능하도록 확장시켜야 한다. 이를 위해 한 분야에서 학습된...HTML5 [HyperText Markup Language Version 5]국제 웹 표준화 단체인 W3C(World Wide Web Consortium)에서 개발·관리하고 있는 웹 페이지 개발 언어 HTML의 5번째 버전. 웹 표준 마크업 언어인 HTML(HyperText Markup Language)의 가장 최신 버전이다. 1990년대 초 영국의 과학자 팀 버너스 리(Tim Berners-Lee)가 처음 제안한 HTML 1.0 이후로 몇 번의 변화를 거쳐 현재의 HTML5까지 업데이트 되었다. 2014년 웹 표준으로 지정되면서 다양한 웹 서비스에 활용되고 있다. 인터넷이 발달함에 따라 텍스트뿐만 아니라 그래픽·동영상 등 멀티미디어에 대한 요구가 급속히 증가하였는데, 기존의 HTML은 이러한 부분에 대한 지원이 미흡하였다. 이를 보완하고 그래픽 기반의 사용자 인터페이스(GUI, Graphical User Interface) 중심으로 더욱 효과적으로 정보를 공유하기 위한 목적으로 개발되었으며, 또한 웹의 빠른 변화 속도에 적응하기 위해 보다 향상된 기능의 태그를 추가하였다. [HTML5 특징] 기존...차원의 저주 [Curse of Dimensionality]데이터 사이언스에서 데이터의 표현 차원의 크기가 증가함에 따라 발생하는 문제들로, 기계 학습의 성능을 저하시킨다. 차원의 저주는 데이터의 표현 차원의 크기가 큰 경우 분포를 학습하는 데에 필요한 데이터의 수가 충분하지 않아 나타나는 현상이다. 데이터 포인트의 차원이 큰 경우 데이터의 공간을 채우는 데에 필요한 데이터의 양이 기하급수적으로 늘어나게 되므로 데이터의 분포를 부정확하게 학습할 수 있다. [차원의 저주의 영향] 예를 들어, (0, 1, 2, 3, 4)의 범위에 존재하는 정수 형태의 데이터 공간을 학습한다고 할 때, 1차원에서는 해당 공간을 채우는 데에 5개의 데이터가 필요하지만, 2차원에서는 25개, 3차원에서는 125개로 크게 증가하게 된다. 만약 기계 학습(머신 러닝)의 목적이 데이터를 구분하는 경계에 해당하는 결정 공간(Decision Boundary)를 찾는 문제라면, 데이터의 밀도가 희박한 경우 과적합(Overfitting)의 문제가 발생할 수 있다. 과적합이란 모델이...언어 모델 [Language Model]컴퓨터가 인간의 언어를 이해할 수 있도록 설계된 모델. 인간의 언어를 컴퓨터가 이해할 수 있는 형태로 변환하여 처리하는 모델을 말한다. 언어 모델은 언어 데이터를 단순히 규칙에 따라 분류하는 모델부터, 오늘날 통계적 분석과 딥 러닝을 활용하여 언어의 의미를 이해하는 모델까지 발전해 오고 있다. [언어 모델의 역사] 초창기의 언어 모델은 언어 데이터를 받아 분류하거나, 특성이나 패턴을 추출하는 방법으로 규칙 기반의 접근법을 사용했다. 예를 들면 특정 단어가 존재할 경우 메일을 스팸 메일로 처리하거나 적절한 답변을 제시하는 초기의 챗봇이 이에 해당했다. 하지만 규칙 기반 모델은 언어의 복잡성과 다양성을 처리하는데 한계가 있었다. 그 후, 언어를 통계적으로 분석하는 방법들이 등장했는데, 문장을 단어나 글자의 집합으로 표시하는 단어 가방 모형(Bag of Words, BoW)이 대표적이다. 단어 가방 모형을 활용하여 문서에서 단어의 중요도를 계산하는 ‘TF-IDF’, 문서의...딥페이크 [Deepfake]인공지능을 활용하여, 인간의 이미지를 합성하는 기술을 일괄적으로 부르는 용어. 딥페이크는 인공지능을 활용한 이미지 합성 기술의 일종으로, 영상이나 사진의 얼굴에 다른 사람의 얼굴을 합성하여 가짜 영상을 생성하는 기술을 의미한다. 최근에는 피싱이나 가짜 뉴스, 성범죄에 딥페이크를 악용하는 사례가 증가하여 사회적인 문제를 낳고 있다. [딥페이크의 기술적 배경] 딥페이크는 새로운 데이터를 만들어 내는 생성 인공지능 기술에 기반한다. 대표적인 생성 인공지능 기술인 생성적 적대 신경망(Generative Adversarial Network, GAN)과 변분 오토인코더(Variational AutoEncoder, VAE) 등의 알고리즘이 주로 사용되고 있다. 가장 대표적인 모델인 생성적 적대 신경망 기반의 딥페이크를 예로 들면, 딥페이크 모델은 기존의 영상의 얼굴을 변화시키는 생성자(Generator)와 이를 기존 영상과 판별하는 판별자(Discriminator)로 나누어진다. 생성자는 결과물로...추천 시스템 [Recommend System]사용자의 미래 행동이나 선호도를 예측하여 상품이나 서비스를 권유하거나 제시하는 인공지능 시스템. 사용자의 행동이나 선호도를 사전에 예측하여 이에 맞는 서비스나 상품을 제안하는 인공지능 시스템을 말한다. 미래의 행동을 예측하는 대부분의 기술이 넓은 범위에서 추천 시스템에 해당하나, 일반적으로는 사용자와 사용자가 선택하는 아이템이 존재하여 사용자에게 아이템을 추천하는 방법, 그리고 소셜 네트워크 서비스에서 사용자에게 사용자를 추천하는 방법을 추천 시스템이라고 부른다. 온라인 쇼핑몰과 동영상 스트리밍 서비스, OTT 서비스가 소비자에게서 차지하는 비중이 크게 증가하면서, 다량의 상품들 중 한정된 시간과 기회 내에 소비자가 관심을 가질 만한 상품을 제안하는 방법이 중요하게 활용되고 있다. [추천 시스템의 종류] 추천 시스템은 추천의 대상이 되는 정보에 따라 나눌 수 있다. 우선 단순히 물건의 구매나 페이지의 클릭만을 예측하는 경우, 해당...초거대 인공