기본 콘텐츠로 건너뛰기

Stream java8

List, Map, Set, Array 들과는 달리 내부적인 저장소가 없다.

 주로 사용하는 Collections 들은 내부적으로 저장소가 있다. 심지어 String마저도 내부적으로는 char[] 를 가지고 있다. 대부분의 자료구조들이 자체적으로 값을 가지고 있는것에 반해 Stream은 저장소를 별도로 가지고 있지 않다.
List<String> l = new ArrayList(Arrays.asList("one", "two"));  
Stream<String> sl = l.stream();  
l.add("three");  
String s = sl.collect(joining(" "));  
System.out.println(s);
위코드의 출력값은 “one two three” 이다. 계속 참조하고 있다라고 이해하는게 차라리 받아들이기 쉬울 것 같다.

pipeline

  • Stream에서 호출하는 함수들은 대부분 pipeline 인터페이스에 정의되어있다.
  • 파이프라인에서 사용되는 함수들은 크게 2가지다. 중개함수, 종료함수
 - 중개함수 : filter(), map(), sorted() .. 
 - 종료함수 : sum(), max() ..
  • 중개함수는 Stream을 구성하는 엘리먼트들이 서로 연관성이 있느냐에 따라 stateless, stateful로 나뉜다.
   - stateless : filter(), map()... 
   - stateful : sorted()..
이렇게 나누는 또 다른 이유는 Stream을 병렬로 실행했을때 안정성을 확보할 수 있느냐 없느냐의 차이일 수도 있다.
  • 종료함수들은 내부적으로 reduce()를 호출하는데, reduce()함수 호출시 Stream이 재사용할 수 없도록 Stream의 상태값을 마킹(?)한다.
  • 종료함수가 실행되기 이전까지 중개함수들은 lazy방식으로 실행되어 불필요한 연산을 줄일 수 있다고 한다.

성능

for-loop, stream, parallelstream 3가지를 비교해보는 테스트 코드를 진행해봤다.
테스트내용은 반복 10만, 조건1가지, 수행코드1가지다.
private double testForloop(int type){  
 long t0 = nanoTime();  
 long elapsed = 0;  
  
  //int array  
  if(type==0){  
         int sum=0;  
   for(int i=0; i<100000; i++){  
            if(i%5==0){  
                sum+=i;  
     }  
    }  
  } else if(type==1){  
        List<String> result = new ArrayList<>();  
  for(int i=0; i<100000; i++){  
            if(i%5==0){  
             result.add("No." + String.valueOf(i));  
     }  
        }  
  }  
  elapsed = nanoTime() - t0;  
  double res =  elapsed / Math.pow(10, 9);  
  return res;  
}
/*-------------------------------------------------*/
private double testStream(int type){  
  long t0 = nanoTime();  
  long elapsed = 0;  
   
  if(type==0){
    int sum = 0;  
    sum = IntStream.range(0,100000)
    .filter(i->i%5==0)
    .sum();  
  }else if(type==1){  
    List<String> result = new ArrayList<>();  
    result = IntStream.range(0,100000)
   .filter(i->i%5==0)
   .mapToObj(i -> "No." + String.valueOf(i))
   .collect(Collectors.toList());  
  }  
  elapsed = nanoTime() - t0;  
  double res =  elapsed / Math.pow(10, 9);  
  return res;    
}
/*-------------------------------------------------*/
private double testParallelStream(int type){  
  long t0 = nanoTime();  
  long elapsed = 0;  
  if(type==0){  
    int sum = 0;  
 sum = IntStream.range(0,100000)
 .parallel()
 .filter(i->i%5==0)
 .sum();  
  }else if(type==1){  
    List<String> result = new ArrayList<>();  
    result = IntStream.range(0,100000)
      .parallel()
      .filter(i->i%5==0)
      .mapToObj(i -> "No." + String.valueOf(i))
      .collect(Collectors.toList());  
  }  
  
  elapsed = nanoTime() - t0;  
  double res =  elapsed / Math.pow(10, 9);  
  return res;  
}
작업을 실행할때 primitive type인 int형 배열과, Object인 ArrayList를 가지고 거의 동일한 행동을 하도록 작성하였다. 그리고 다음과 같은 실행결과를 얻었다..
Array 
for-loop / Stream / ParallelStream
0.006007506000000001/0.18573956100000014/0.04818631299999998
ArrayList 
for-loop / Stream / ParallelStream
0.4064511349999998/0.596784643/0.3017301929999999
나름대로 의미가 있었다.
ParallelStream이 단일 Stream 보다는 확실히 성능이 좋았다.
array를 사용할때는 단순 for문이 월등하게 성능이 좋았고
arrayList를 사용할때는 ParallelStream이 좋았다.

array는 내부적으로 index 를 가지고 있기때문에 변환작업이 있는 Stream 보다는 성능이 나은것으로 보여진다. 그리고 Stream은 cpu 부하에 크게 부담을 주지 않는다면 가급적 병렬로 사용하는것이 좋을듯 하다.

댓글

이 블로그의 인기 게시물

메일서버가 스팸으로 취급받을때

설치한 메일서버를 통해 발송되는 메일이 스팸으로 들어가는 경우가 더러 있다. 이게 한번 들어가기는 쉬운데, 빠져나오기는 드럽게 힘든것 같다... 본인의 경우에는 우선 국내서비스에는 별 무리 없이 들어간다. (naver,daum 등) 그런데 해외메일 그중 Gmail, Hotmail 에는 에누리없이 스팸으로 간주되고 있었다. Gmail같은 경우에는 그래도 스팸함으로 발송은 제대로 되는반면에 Hotmail같은경우에는 아예 수신자체가 안되는 경우도 더러있다.. ㅡ,.ㅡ; 제일 좋은 방법은 Gmail,Hotmail에 전화걸어서 우리 메일서버 IP white Ip로 등록해달라!!! 하면 좋지만, 얘네들은 걸어봤자 자동응답기고, 문의채널은 구글 그룹스 게시판이 전부다.. 본론으로 들어가서. 해외 메일이 차단될 경우 내 매일서버ip가 스팸ip로 등록되 버린 경우일 수 있다. (본인처럼. ㅎ) 이것부터 조회 해보고 싶으면 RBL(real-time blocking List) 체크를 해야 하는데, RBL체크 해주는 사이트는 꽤 많이 있고, 그중 좀 깔끔해 보이는곳 하나 소개. http://www.anti-abuse.org/ 메일서버ip 입력하고 조회해보면 쭈루룩 리스트가 나온다. 그 중 빨간불이 들어온 부분이 메일 서버가 스팸서버가 된 각종 이유들이다.ㅋ 본인의 경우 CBL 때문에 걸렸는데, 내용은 아래와 같다. This IP address is HELO'ing as  "localhost.localdomain"  which violates the relevant standards (specifically: RFC5321). 메일서버 도메인에 별다른 작업을 안해놓아서 "localhost.localdomain" 으로 설정되어있었다. 만약 CBL만 바로 테스트 해보고 싶으면 http://cbl.abusea

[javascript] 특정시간에만 함수 실행

특정시간에만 팝업을 띄우려면?? 특정시간에만 로그인을 막으려면?? 특정시간에만 할일은 의외로 참 많다. 방법? 딱히 없다. 현재시간 구해서 시작시간, 종료시간 사이에 있을때 시작하는 수밖엔. if ((현재시간 > 시작시간) && (현재시간 < 종료시간)){ .. 팝업노출(); 공사페이지 리다이렉트(); 기타등등(); .. } 자바스크립트로 작성하면 다음과 같다. var startdate = "2014012008" ; var enddate = "2014012418" ; var now = new Date (); //현재시간 year = now. getFullYear (); //현재시간 중 4자리 연도 month = now. getMonth () + 1 ; //현재시간 중 달. 달은 0부터 시작하기 때문에 +1 if ((month + "" ). length < 2 ){ month = "0" + month; //달의 숫자가 1자리면 앞에 0을 붙임. } date = now. getDate (); //현재 시간 중 날짜. if ((date + "" ). length < 2 ){ date = "0" + date; } hour = now. getHours (); //현재 시간 중 시간. if ((hour + "" ). length < 2 ){ hour = "0" + hour; } today = year + "" + month + "" + date + "" + hour; //오늘 날짜 완성. / / 시간비교 i

스레드 동기화1 - syncronized

구현 스레드를 구현하는 방법은 2가지다. 1. Thread 클래스를 extends 한다. 2. Runnable 인터페이스를 implements 한다. 뭐 사실 Thread는 생성자의 변수로 Runnable을 취한다. public Thread (Runnable target) { init( null, target , "Thread-" + nextThreadNum () , 0 ) ; } 그리고 Runnable 인터페이스는 run() 이라는 단일함수를 갖는 인터페이스이다. @FunctionalInterface public interface Runnable { /** * When an object implementing interface <code> Runnable </code> is used * to create a thread, starting the thread causes the object's * <code> run </code> method to be called in that separately executing * thread. * <p> * The general contract of the method <code> run </code> is that it may * take any action whatsoever. * * @see java.lang.Thread#run() */ public abstract void run () ; } 그렇기 때문에 람다식으로 표현이 가능한 것이다. 동기화 동기화는 동시에 같은자원의 접근을 제한하고자 할때 사용한다. 예를들어, 한 우물에서 물을 15번 길어야 하는 일을 해야할때 5명이서 3번만 하면 수고를 5배로 줄일수 있다. 그런데 우물은 하난데 동시에