본문 바로가기

개발183

group by 내부정렬 SELECT number, FROM testGROUP BY number, nameORDER BY number desc, name - order by 에 있는데, group by 에 없으면 에러 - order by 에서 name 이 빠져버리면 전체 그룹의 순서가 깨짐. 걍 group by 순서를 그대로 order by 에도 적용하면 됨. 2017. 2. 21.
HAVING 절 발효(?) 타이밍 mysql> SELECT * -> FROM A a -> GROUP BY a.value1, a.value2 -> HAVING count(*) > 1 -> ;+------+--------+--------+| id | value1 | value2 |+------+--------+--------+| 1 | 10 | kkk |+------+--------+--------+1 row in set (0.01 sec) HAVING은 GROUP BY에 부여하는 조건을 명시한다. 위의 예는 HAVING을 사용하여 중복된 ROW를 찾는 예이다. 그런데 여기서 의문점이 제기된다. '도대체 HAVING이 적용되는 시점은 언제일까?' 테이블 A에서 count(*)>1 인 녀석을 먼저 찾고 GROUP BY가 적용될까?아니면, GR.. 2017. 2. 21.
SPARK 의 헷갈림 reduce(), fold() 아래와 같은 현상이 이상했다. >>> reduce(lambda x, y: (x*2) + y, [1,2,3,4])26>>> sc.parallelize([1,2,3,4]).reduce(lambda x, y: (x*2) + y)18>>> sc.parallelize([1,2,3,4],1).reduce(lambda x, y: (x*2) + y)26>>> sc.parallelize([1,2,3,4],2).reduce(lambda x, y: (x*2) + y)18>>> sc.parallelize([1,2,3,4],3).reduce(lambda x, y: (x*2) + y)18>>> sc.parallelize([1,2,3,4],4).reduce(lambda x, y: (x*2) + y)26 뭐지? partition 을.. 2017. 2. 16.
SPARK reduce() 개념도 출처 : http://backtobazics.com/big-data/spark/apache-spark-reduce-example/ 2017. 2. 16.