스칼라는 크기만으로 나타낼 수 있는 물리량을 나타낸다.
데이터들의 집합을 데이터 셋(data set)이라고 할때, 스칼라는 데이터 셋을 구성하는 하나의 구성원소, 하나의 숫자라고도 생각할 수 있다.
앞으로 프로그래밍에서 하나의 숫자 리터럴은 스칼라 값이라고 생각할 수 있다.
벡터는 스칼라의 집합이며, 행렬(matrix)을 구성하는 기본 단위이다.
벡터에는 크기 뿐만 아니라 방향에 대한 정보도 담겨있다.
벡터는 행벡터와 열벡터 두가지로 나뉜다. 벡터를 구성하는 스칼라를 행 방향으로 나열하면 행 백터(row vector)라고 하고, 열 방향으로 나열하면 열 백터(column vector)라고 한다.
💡 이 책에서는 특별한 언급이 없으면 벡터를 열 벡터로 사용할 것이다.
앞으로 데이터 셋(data set)은 하나의 행렬이라고 생각할 수 있다. 행 벡터는 데이터 셋의 하나의 레코드, 열 벡터는 특정 컬럼의 값들로 생각할 수 있다.
💡 데이터 분석에서는 데이터 행을 데이터 레코드(record), 특정 컬럼에 속한 값들을 **피처(feature)**라고 한다.
벡터를 기하학적으로 표현하면 길이는 해당 벡터의 크기(magnitude)가 된다. 벡터가 가리키는 방향은 벡터의 방향(direction)이 된다. 만약 서로 다른 벡터의 크기와 방향이 같다면 해당 벡터는 동일한 벡터이다.
영 벡터(zero vector)는 크기가 0인 벡터를 의미하고, 벡터의 시작과 종료 지점이 동일하다.