기본 콘텐츠로 건너뛰기

chap13 콜렉션 (Collections)

1. 콜렉션 계층도

scala의 콜렉션 계층도는 이렇다.
크게, set,map,seq



Graph legend


http://docs.scala-lang.org/tutorials/FAQ/collections.html


2. 수정가능한 콜렉션과 수정불가능한 콜렉션

 앞의 Map을 다룰때 한번 나왔었다, immutable, mutable한 Map
 수정불가능한것은 값이 변하지 않으니 안전하게 참조할 수 있어 좋다.
 스칼라에서는 별도 명시가 없을 경우 immutable 한 경우로 취급한다.

3. 시퀀스

 Vector는 Arraybuffer의 수정불가능한 버전, 각노드가 32개까지 자식을 가질 수 있는 트리로 구현된다. 백만개의 원소가 있는 벡터는 4개의 노드 레이어가 필요(10의6승 ~ 32의4승) 그래서 4번만의 접근이 가능.

 Range는 시퀀스의 모든값을 저장하지 않는다. 시작, 종료, 증가분만 저장, to, until 메소드로 생성된다.


4. 리스트

scala> val digits = List(4,2)
digits: List[Int] = List(4, 2)
scala> digits.head
res0: Int = 4
scala> digits.tail
res1: List[Int] = List(2)
scala> digits.tail.head
res2: Int = 2

:: 연산자로 리스트 멤버를 추가
scala> 9 :: digits
res4: List[Int] = List(9, 4, 2)

List에서 원소들을 방문할때 이터레이터를 사용하지만 스칼라에서는 재귀를 사용하는게 자연스럽다
scala> def sum(lst: List[Int]):Int =
     | if(lst==Nil) 0 else lst.head + sum(lst.tail)
sum: (lst: List[Int])Int

scala> sum(digits)
res5: Int = 6


5. 집합

scala> Set(1,2,3,4,5,6)
res10: scala.collection.immutable.Set[Int] = Set(5, 1, 6, 2, 3, 4)
순서를 보장하지 않는다,
집합은 원소가 hashCode 메소드의 값에 따라 정리되는 해시집합으로 구현된다.
해시집합에서 원소를 찾는 것은 배열이나 리스트에서 찾는것보다 훨씬 빠르다.

링크드 해시집합은 원소의 삽입순소를 기억한다.
scala> scala.collection.mutable.LinkedHashSet(1,2,3,4,5,6)
res15: scala.collection.mutable.LinkedHashSet[Int] = Set(1, 2, 3, 4, 5, 6)


6. 원소 추가/삭제

 ㄱ. 시퀀스 뒤에 추가 (:+) 혹은 앞에 추가(+:)
 ㄴ. 순서없는 콜렉션에 추가(+)
 ㄷ. 제거 (-)
 ㄹ. 대량 추가/제거(++/--)
 ㅁ. 리스트에대해서는 :: / ::: 선호
 ㅂ. 변경은 += , ++=, -=, --=
 ㅅ. 집합에 대해서는 ++, &, --


7. 리듀싱, 폴딩, 스캐닝

scala> List(1,7,2,9).reduceLeft(_-_)
res1: Int = -17
scala> List(1,7,2,9).reduceRight(_-_)
res2: Int = -13

reduceLeft : ((1-7) -2) -9 = -17
reduceRight : 1-(7-(2-9)) = - 13

초기값을 주고 시작할 수 도 있다.
scala> List(1,7,2,9).foldLeft(0)(_ - _)
res13: Int = -19

중간결과에 콜렉션을 얻을 수도 있다.
scala> (1 to 10).scanLeft(0)(_ + _)
res14: scala.collection.immutable.IndexedSeq[Int] = Vector(0, 1, 3, 6, 10, 15, 21, 28, 36, 45, 55)

scala> (1 to 10).foldLeft(0)(_ + _)
res15: Int = 55


8. 지핑

두개의 list를 합칠수도 있다.

prices: List[Double] = List(5.0, 20.0, 9.95)
quantities: List[Int] = List(10, 2, 1)
scala> prices zip quantities
res16: List[(Double, Int)] = List((5.0,10), (20.0,2), (9.95,1))

갯수가 같아서 망정이지
한쪽이 적으면 적은수 기준으로 많은쪽 컬렉션의 원소들은 zip에서 제외된다.
하지만 디폴트값으로 예방할 순 있다.
scala> prices zipAll(List(10,2),0.0,1)
res21: List[(Double, Int)] = List((5.0,10), (20.0,2), (9.95,1))


9. 스트림

이터레이터 비슷한 기능인데, '레이지' 개념을 바탕으로 한다.
따라서, 컬렉션의 필요하지 않은 남은 원소들을 계산하는 비용이 들지 않는 장점이 있다.

scala> def numsFrom(n : BigInt): Stream[BigInt] = n#::numsFrom(n +1)
numsFrom: (n: BigInt)Stream[BigInt]

scala> val tenOrMore = numsFrom(10)
tenOrMore: Stream[BigInt] = Stream(10, ?)

scala> tenOrMore.tail
res0: scala.collection.immutable.Stream[BigInt] = Stream(11, ?)

scala> val squares = numsFrom(1).map(x=>x*x)
squares: scala.collection.immutable.Stream[scala.math.BigInt] = Stream(1, ?)

scala> squares.take(5).force
res1: scala.collection.immutable.Stream[scala.math.BigInt] = Stream(1, 4, 9, 16, 25)


10 병렬콜렉션

par 메소드는 콜렉션의 병렬구현을 생성한다.

scala> for (i <- (0 until 100).par) print ( i + " ")
0 50 51 52 25 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 7 ...

순서대로 안나오는거 보면 병렬을 하는거 싶기도하다.


댓글

이 블로그의 인기 게시물

메일서버가 스팸으로 취급받을때

설치한 메일서버를 통해 발송되는 메일이 스팸으로 들어가는 경우가 더러 있다. 이게 한번 들어가기는 쉬운데, 빠져나오기는 드럽게 힘든것 같다... 본인의 경우에는 우선 국내서비스에는 별 무리 없이 들어간다. (naver,daum 등) 그런데 해외메일 그중 Gmail, Hotmail 에는 에누리없이 스팸으로 간주되고 있었다. Gmail같은 경우에는 그래도 스팸함으로 발송은 제대로 되는반면에 Hotmail같은경우에는 아예 수신자체가 안되는 경우도 더러있다.. ㅡ,.ㅡ; 제일 좋은 방법은 Gmail,Hotmail에 전화걸어서 우리 메일서버 IP white Ip로 등록해달라!!! 하면 좋지만, 얘네들은 걸어봤자 자동응답기고, 문의채널은 구글 그룹스 게시판이 전부다.. 본론으로 들어가서. 해외 메일이 차단될 경우 내 매일서버ip가 스팸ip로 등록되 버린 경우일 수 있다. (본인처럼. ㅎ) 이것부터 조회 해보고 싶으면 RBL(real-time blocking List) 체크를 해야 하는데, RBL체크 해주는 사이트는 꽤 많이 있고, 그중 좀 깔끔해 보이는곳 하나 소개. http://www.anti-abuse.org/ 메일서버ip 입력하고 조회해보면 쭈루룩 리스트가 나온다. 그 중 빨간불이 들어온 부분이 메일 서버가 스팸서버가 된 각종 이유들이다.ㅋ 본인의 경우 CBL 때문에 걸렸는데, 내용은 아래와 같다. This IP address is HELO'ing as  "localhost.localdomain"  which violates the relevant standards (specifically: RFC5321). 메일서버 도메인에 별다른 작업을 안해놓아서 "localhost.localdomain" 으로 설정되어있었다. 만약 CBL만 바로 테스트 해보고 싶으면 http://cbl.abusea

[javascript] 특정시간에만 함수 실행

특정시간에만 팝업을 띄우려면?? 특정시간에만 로그인을 막으려면?? 특정시간에만 할일은 의외로 참 많다. 방법? 딱히 없다. 현재시간 구해서 시작시간, 종료시간 사이에 있을때 시작하는 수밖엔. if ((현재시간 > 시작시간) && (현재시간 < 종료시간)){ .. 팝업노출(); 공사페이지 리다이렉트(); 기타등등(); .. } 자바스크립트로 작성하면 다음과 같다. var startdate = "2014012008" ; var enddate = "2014012418" ; var now = new Date (); //현재시간 year = now. getFullYear (); //현재시간 중 4자리 연도 month = now. getMonth () + 1 ; //현재시간 중 달. 달은 0부터 시작하기 때문에 +1 if ((month + "" ). length < 2 ){ month = "0" + month; //달의 숫자가 1자리면 앞에 0을 붙임. } date = now. getDate (); //현재 시간 중 날짜. if ((date + "" ). length < 2 ){ date = "0" + date; } hour = now. getHours (); //현재 시간 중 시간. if ((hour + "" ). length < 2 ){ hour = "0" + hour; } today = year + "" + month + "" + date + "" + hour; //오늘 날짜 완성. / / 시간비교 i

[linux] 모든 cron 확인

예전에 만들어놓은 cron이 요새 안돌고 있어서 찾아봤다. 물론 내가 만들었던 아니고ㅋ crontab -l no crontab for root 헐, 내가 찾던 cron이 안보인다. 분명히 예전 사수가 여기다 작업 해놓은것 같았는데... cron이 뭐하는 놈인지는 알아도, 어떻게 생겨먹은놈인지는 몰랐다ㅋ 이리저리 폴더 뒤져서 그때 스크립트 파일을 찾아보기 시작했다. 멍청한짓을 한 참 한후에 혹하는 마음에 로컬 사용자 뭐있나 찍어봄 cat /etc/passwd 찍어보믄 계정별로 결과가 쭈루루룩 나오는데, 뜻은 이거다. 계정:암호:UID:GID:정보:디렉토리:쉘 passwd 파일 설명은 ( http://www.linuweb.com/?p=248 ) 여기 님 블로그에 잘 되어있음. 암튼 결국 계정별로 cron 걸려있는거 죄다 찍어보니 for user in $(cut -f1 -d: /etc/passwd); do echo id $user; crontab -u $user -l ; done 한번에 다찍어주는 명령어는 따로 없나보다. 간단하게 스크립트로 찍어주는 수밖에. 결국 내가 찾던 cron은 처음보는 계정에 들어있었음. 그리고 cron이 안돌던 이유는 ftp가 막혀서였고 ㅋ