기본 콘텐츠로 건너뛰기

Stream java8

List, Map, Set, Array 들과는 달리 내부적인 저장소가 없다.

 주로 사용하는 Collections 들은 내부적으로 저장소가 있다. 심지어 String마저도 내부적으로는 char[] 를 가지고 있다. 대부분의 자료구조들이 자체적으로 값을 가지고 있는것에 반해 Stream은 저장소를 별도로 가지고 있지 않다.
List<String> l = new ArrayList(Arrays.asList("one", "two"));  
Stream<String> sl = l.stream();  
l.add("three");  
String s = sl.collect(joining(" "));  
System.out.println(s);
위코드의 출력값은 “one two three” 이다. 계속 참조하고 있다라고 이해하는게 차라리 받아들이기 쉬울 것 같다.

pipeline

  • Stream에서 호출하는 함수들은 대부분 pipeline 인터페이스에 정의되어있다.
  • 파이프라인에서 사용되는 함수들은 크게 2가지다. 중개함수, 종료함수
 - 중개함수 : filter(), map(), sorted() .. 
 - 종료함수 : sum(), max() ..
  • 중개함수는 Stream을 구성하는 엘리먼트들이 서로 연관성이 있느냐에 따라 stateless, stateful로 나뉜다.
   - stateless : filter(), map()... 
   - stateful : sorted()..
이렇게 나누는 또 다른 이유는 Stream을 병렬로 실행했을때 안정성을 확보할 수 있느냐 없느냐의 차이일 수도 있다.
  • 종료함수들은 내부적으로 reduce()를 호출하는데, reduce()함수 호출시 Stream이 재사용할 수 없도록 Stream의 상태값을 마킹(?)한다.
  • 종료함수가 실행되기 이전까지 중개함수들은 lazy방식으로 실행되어 불필요한 연산을 줄일 수 있다고 한다.

성능

for-loop, stream, parallelstream 3가지를 비교해보는 테스트 코드를 진행해봤다.
테스트내용은 반복 10만, 조건1가지, 수행코드1가지다.
private double testForloop(int type){  
 long t0 = nanoTime();  
 long elapsed = 0;  
  
  //int array  
  if(type==0){  
         int sum=0;  
   for(int i=0; i<100000; i++){  
            if(i%5==0){  
                sum+=i;  
     }  
    }  
  } else if(type==1){  
        List<String> result = new ArrayList<>();  
  for(int i=0; i<100000; i++){  
            if(i%5==0){  
             result.add("No." + String.valueOf(i));  
     }  
        }  
  }  
  elapsed = nanoTime() - t0;  
  double res =  elapsed / Math.pow(10, 9);  
  return res;  
}
/*-------------------------------------------------*/
private double testStream(int type){  
  long t0 = nanoTime();  
  long elapsed = 0;  
   
  if(type==0){
    int sum = 0;  
    sum = IntStream.range(0,100000)
    .filter(i->i%5==0)
    .sum();  
  }else if(type==1){  
    List<String> result = new ArrayList<>();  
    result = IntStream.range(0,100000)
   .filter(i->i%5==0)
   .mapToObj(i -> "No." + String.valueOf(i))
   .collect(Collectors.toList());  
  }  
  elapsed = nanoTime() - t0;  
  double res =  elapsed / Math.pow(10, 9);  
  return res;    
}
/*-------------------------------------------------*/
private double testParallelStream(int type){  
  long t0 = nanoTime();  
  long elapsed = 0;  
  if(type==0){  
    int sum = 0;  
 sum = IntStream.range(0,100000)
 .parallel()
 .filter(i->i%5==0)
 .sum();  
  }else if(type==1){  
    List<String> result = new ArrayList<>();  
    result = IntStream.range(0,100000)
      .parallel()
      .filter(i->i%5==0)
      .mapToObj(i -> "No." + String.valueOf(i))
      .collect(Collectors.toList());  
  }  
  
  elapsed = nanoTime() - t0;  
  double res =  elapsed / Math.pow(10, 9);  
  return res;  
}
작업을 실행할때 primitive type인 int형 배열과, Object인 ArrayList를 가지고 거의 동일한 행동을 하도록 작성하였다. 그리고 다음과 같은 실행결과를 얻었다..
Array 
for-loop / Stream / ParallelStream
0.006007506000000001/0.18573956100000014/0.04818631299999998
ArrayList 
for-loop / Stream / ParallelStream
0.4064511349999998/0.596784643/0.3017301929999999
나름대로 의미가 있었다.
ParallelStream이 단일 Stream 보다는 확실히 성능이 좋았다.
array를 사용할때는 단순 for문이 월등하게 성능이 좋았고
arrayList를 사용할때는 ParallelStream이 좋았다.

array는 내부적으로 index 를 가지고 있기때문에 변환작업이 있는 Stream 보다는 성능이 나은것으로 보여진다. 그리고 Stream은 cpu 부하에 크게 부담을 주지 않는다면 가급적 병렬로 사용하는것이 좋을듯 하다.

댓글

이 블로그의 인기 게시물

메일서버가 스팸으로 취급받을때

설치한 메일서버를 통해 발송되는 메일이 스팸으로 들어가는 경우가 더러 있다. 이게 한번 들어가기는 쉬운데, 빠져나오기는 드럽게 힘든것 같다... 본인의 경우에는 우선 국내서비스에는 별 무리 없이 들어간다. (naver,daum 등) 그런데 해외메일 그중 Gmail, Hotmail 에는 에누리없이 스팸으로 간주되고 있었다. Gmail같은 경우에는 그래도 스팸함으로 발송은 제대로 되는반면에 Hotmail같은경우에는 아예 수신자체가 안되는 경우도 더러있다.. ㅡ,.ㅡ; 제일 좋은 방법은 Gmail,Hotmail에 전화걸어서 우리 메일서버 IP white Ip로 등록해달라!!! 하면 좋지만, 얘네들은 걸어봤자 자동응답기고, 문의채널은 구글 그룹스 게시판이 전부다.. 본론으로 들어가서. 해외 메일이 차단될 경우 내 매일서버ip가 스팸ip로 등록되 버린 경우일 수 있다. (본인처럼. ㅎ) 이것부터 조회 해보고 싶으면 RBL(real-time blocking List) 체크를 해야 하는데, RBL체크 해주는 사이트는 꽤 많이 있고, 그중 좀 깔끔해 보이는곳 하나 소개. http://www.anti-abuse.org/ 메일서버ip 입력하고 조회해보면 쭈루룩 리스트가 나온다. 그 중 빨간불이 들어온 부분이 메일 서버가 스팸서버가 된 각종 이유들이다.ㅋ 본인의 경우 CBL 때문에 걸렸는데, 내용은 아래와 같다. This IP address is HELO'ing as  "localhost.localdomain"  which violates the relevant standards (specifically: RFC5321). 메일서버 도메인에 별다른 작업을 안해놓아서 "localhost.localdomain" 으로 설정되어있었다. 만약 CBL만 바로 테스트 해보고 싶으면 http://cbl.abusea

[javascript] 특정시간에만 함수 실행

특정시간에만 팝업을 띄우려면?? 특정시간에만 로그인을 막으려면?? 특정시간에만 할일은 의외로 참 많다. 방법? 딱히 없다. 현재시간 구해서 시작시간, 종료시간 사이에 있을때 시작하는 수밖엔. if ((현재시간 > 시작시간) && (현재시간 < 종료시간)){ .. 팝업노출(); 공사페이지 리다이렉트(); 기타등등(); .. } 자바스크립트로 작성하면 다음과 같다. var startdate = "2014012008" ; var enddate = "2014012418" ; var now = new Date (); //현재시간 year = now. getFullYear (); //현재시간 중 4자리 연도 month = now. getMonth () + 1 ; //현재시간 중 달. 달은 0부터 시작하기 때문에 +1 if ((month + "" ). length < 2 ){ month = "0" + month; //달의 숫자가 1자리면 앞에 0을 붙임. } date = now. getDate (); //현재 시간 중 날짜. if ((date + "" ). length < 2 ){ date = "0" + date; } hour = now. getHours (); //현재 시간 중 시간. if ((hour + "" ). length < 2 ){ hour = "0" + hour; } today = year + "" + month + "" + date + "" + hour; //오늘 날짜 완성. / / 시간비교 i

[linux] 모든 cron 확인

예전에 만들어놓은 cron이 요새 안돌고 있어서 찾아봤다. 물론 내가 만들었던 아니고ㅋ crontab -l no crontab for root 헐, 내가 찾던 cron이 안보인다. 분명히 예전 사수가 여기다 작업 해놓은것 같았는데... cron이 뭐하는 놈인지는 알아도, 어떻게 생겨먹은놈인지는 몰랐다ㅋ 이리저리 폴더 뒤져서 그때 스크립트 파일을 찾아보기 시작했다. 멍청한짓을 한 참 한후에 혹하는 마음에 로컬 사용자 뭐있나 찍어봄 cat /etc/passwd 찍어보믄 계정별로 결과가 쭈루루룩 나오는데, 뜻은 이거다. 계정:암호:UID:GID:정보:디렉토리:쉘 passwd 파일 설명은 ( http://www.linuweb.com/?p=248 ) 여기 님 블로그에 잘 되어있음. 암튼 결국 계정별로 cron 걸려있는거 죄다 찍어보니 for user in $(cut -f1 -d: /etc/passwd); do echo id $user; crontab -u $user -l ; done 한번에 다찍어주는 명령어는 따로 없나보다. 간단하게 스크립트로 찍어주는 수밖에. 결국 내가 찾던 cron은 처음보는 계정에 들어있었음. 그리고 cron이 안돌던 이유는 ftp가 막혀서였고 ㅋ