Hibernate 进行大数据量处理时的优化操作

1. 在处理大数据量时,会有大量的数据缓冲保存在 Session 的一级缓存中,这缓存大太时会严重显示性能,所以在使用 Hibernate 处理大数据量的,可以使用 session.clear()或者 session. Evict(Object) 在处理过程中,清除全部的缓存或者清除某个对象。 

2. 对大数据量查询时,慎用 list()或者 iterator() 返回查询结果, 

3. 对于关联操作,Hibernate 虽然可以表达复杂的数据关系,但请慎用,使数据关系较为简单时会得到较好的效率,特别是较深层次的关联时,性能会很差。 

4. 对含有关联的 PO(持久化对象)时,若 default-cascade="all" 或者 “save-update”,新增 PO 时,请注意对 PO 中的集合的赋值操作,因为有可能使得多执行一次 update 操作。 

5. 在一对多、多对一的关系中,使用延迟加载机制,会使不少的对象在使用时方会初始化,这样可使得节省内存空间以及减少数据库的负荷,而且若 PO 中的集合没有被使用时,就可减少互数据库的交互从而减少处理时间。 
 
6. 对于大数据量新增、修改、删除操作或者是对大数据量的查询,与数据库的交互次数是决定处理时间的最重要因素,减少交互的次数是提升效率的最好途径,所以在开发过程中,请将 show_sql 设置为 true,深入了解 Hibernate 的处理过程,尝试不同的方式,可以使得效率提升。 

7.Hibernate 是以 JDBC 为基础,但是 Hibernate 是对 JDBC 的优化,其中使用 Hibernate 的缓冲机制会使性能提升,如使用二级缓存以及查询缓存,若命中率较高明,性能会是到大幅提升。 

8.Hibernate 可以通过设置 hibernate.jdbc.fetch_size,hibernate.jdbc.batch_size 等属性,对 Hibernate 进行优化。
hibernate.jdbc.fetch_size 50 
hibernate.jdbc.batch_size 25 
      Fetch Size 是设定 JDBC 的 Statement 读取数据的时候每次从数据库中取出的记录条数。例如一次查询 1 万条记录,对于 Oracle 的 JDBC 驱动来说,是不会 1 次性把 1 万条取出来的,而只会取出 Fetch Size 条数,当纪录集遍历完了这些记录以后,再去数据库取 Fetch Size 条数据。 
      Batch Size 是设定对数据库进行批量删除,批量更新和批量插入的时候的批次大小,有点相当于设置 Buffer 缓冲区大小的意思。