[jira] [Commented] (CASSANDRA-8337) mmap underflow during validation compaction

Alexander Sterligov (JIRA) Wed, 19 Nov 2014 00:07:59 -0800

    [ 
https://issues.apache.org/jira/browse/CASSANDRA-8337?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel&focusedCommentId=14217584#comment-14217584
 ]


Alexander Sterligov commented on CASSANDRA-8337:
------------------------------------------------

After one crash got exception:
{quote}
ERROR [main] 2014-11-19 11:37:45,741 CassandraDaemon.java:465 - Exception 
encountered during startup
java.lang.NullPointerException: null
        at 
org.apache.cassandra.db.ColumnFamilyStore.removeUnfinishedCompactionLeftovers(ColumnFamilyStore.java:563)
 ~[apache-cassandra-2.1.2.jar:2.1.2]
        at 
org.apache.cassandra.service.CassandraDaemon.setup(CassandraDaemon.java:232) 
[apache-cassandra-2.1.2.jar:2.1.2]
        at 
org.apache.cassandra.service.CassandraDaemon.activate(CassandraDaemon.java:448) 
[apache-cassandra-2.1.2.jar:2.1.2]
        at 
org.apache.cassandra.service.CassandraDaemon.main(CassandraDaemon.java:537) 
[apache-cassandra-2.1.2.jar:2.1.2]
{quote}

I think problem happens in case of lot's of replicas (I have 6 DC with 3 
replicas in each with replication factor 3) and a lots of streaming. I cannot 
reproduce it on 3 replicas in test environment, but it's a stable problem on 18 
replicas with about 1 000 000 small records.

Maybe sstables are compacted and validated before they were fully synced to 
disk?

> mmap underflow during validation compaction
> -------------------------------------------
>
>                 Key: CASSANDRA-8337
>                 URL: https://issues.apache.org/jira/browse/CASSANDRA-8337
>             Project: Cassandra
>          Issue Type: Bug
>            Reporter: Alexander Sterligov
>         Attachments: thread_dump
>
>
> During full parallel repair I often get errors like the following
> {quote}
> [2014-11-19 01:02:39,355] Repair session 116beaf0-6f66-11e4-afbb-c1c082008cbe 
> for range (3074457345618263602,-9223372036854775808] failed with error 
> org.apache.cassandra.exceptions.RepairException: [repair 
> #116beaf0-6f66-11e4-afbb-c1c082008cbe on iss/target_state_history, 
> (3074457345618263602,-9223372036854775808]] Validation failed in 
> /95.108.242.19
> {quote}
> At the log of the node there are always same exceptions:
> {quote}
> ERROR [ValidationExecutor:2] 2014-11-19 01:02:10,847 
> JVMStabilityInspector.java:94 - JVM state determined to be unstable.  Exiting 
> forcefully due to:
> org.apache.cassandra.io.sstable.CorruptSSTableException: java.io.IOException: 
> mmap segment underflow; remaining is 15 but 47 requested
>         at 
> org.apache.cassandra.io.sstable.SSTableReader.getPosition(SSTableReader.java:1518)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.io.sstable.SSTableReader.getPosition(SSTableReader.java:1385)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.io.sstable.SSTableReader.getPositionsForRanges(SSTableReader.java:1315)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.io.sstable.SSTableReader.getScanner(SSTableReader.java:1706)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.io.sstable.SSTableReader.getScanner(SSTableReader.java:1694)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.db.compaction.AbstractCompactionStrategy.getScanners(AbstractCompactionStrategy.java:276)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.db.compaction.WrappingCompactionStrategy.getScanners(WrappingCompactionStrategy.java:320)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.db.compaction.CompactionManager.doValidationCompaction(CompactionManager.java:917)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.db.compaction.CompactionManager.access$600(CompactionManager.java:97)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.db.compaction.CompactionManager$9.call(CompactionManager.java:557)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at java.util.concurrent.FutureTask.run(FutureTask.java:262) 
> ~[na:1.7.0_51]
>         at 
> java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
>  ~[na:1.7.0_51]
>         at 
> java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
>  [na:1.7.0_51]
>         at java.lang.Thread.run(Thread.java:744) [na:1.7.0_51]
> Caused by: java.io.IOException: mmap segment underflow; remaining is 15 but 
> 47 requested
>         at 
> org.apache.cassandra.io.util.MappedFileDataInput.readBytes(MappedFileDataInput.java:135)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.utils.ByteBufferUtil.read(ByteBufferUtil.java:348) 
> ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.utils.ByteBufferUtil.readWithShortLength(ByteBufferUtil.java:327)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         at 
> org.apache.cassandra.io.sstable.SSTableReader.getPosition(SSTableReader.java:1460)
>  ~[apache-cassandra-2.1.2.jar:2.1.2]
>         ... 13 common frames omitted
> {quote}
> Now i'm using die disk_failure_policy to determine such conditions faster, 
> but I get them even with stop policy.
> Streams related to host with such exception are hanged. Thread dump is 
> attached. Only restart helps.
> After retry I get errors from other nodes.
> scrub doesn't help and report that sstables are ok.
> Sequential repairs doesn't cause such exceptions.
> Load is about 1000 write rps and 50 read rps per node.



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (CASSANDRA-8337) mmap underflow during validation compaction

Reply via email to